ВЕСТНИК
Башкирского университета

ENGLISH
Главная Авторам Рецензентам Выпуски журнала Редколлегия Редакция Загрузить статью Подписка ISSN 1998-4812

Архив | Том 23, 2018, No. 3.

СТАТИСТИЧЕСКИЕ МЕТОДЫ В ИССЛЕДОВАНИИ ТЕКСТОВ

Download
  • © В. А. Гречачин

    Башкирский государственный университет

    Россия, Республика Башкортостан, 450076 г. Уфа, ул. Заки Валиди, 32

Целью данной статьи является рассмотрение статистических методов в контексте исследования текстов и определение возможностей их применения. Основное внимание уделено квантитативным характеристикам лингвистических единиц. Рассмотрены основные разновидности частоты употребления лингвистических единиц. Выявлены способы подсчета частоты употребления лингвистических единиц; определены возможности приложения рассмотренных статистических методов в сопоставительных исследованиях текстов; рассмотрены возможности использования описательной статистики для проведения лингвистических исследований. На материале небольшого корпуса текстов проведен анализ особенностей употребления тех или иных частей речи в произведениях нескольких авторов, что может быть использовано для исследований авторского стиля и художественной картины мира произведений. Кроме того, рассмотрен исследовательский потенциал различных визуализаций статистических данных, полученных благодаря частотному анализу единиц в текстах. В рамках данной работы получены данные, которые могут быть использованы для дальнейшего исследования потенциала статистических методов в лингвистических исследованиях.

Ключевые слова:

  • статистика
  • квантитативная лингвистика
  • корпусная лингвистика
  • частотность лингвистических единиц
  • statistics
  • quantitative linguistics
  • corpus linguistics
  • frequency of using linguistic units

ЛИТЕРАТУРА

  1. Арапов М. В. Квантитативная лингвистика. М.: Наука, 1988. 184 с.
  2. Баранов А. В. Введение в прикладную лингвистику. М.: Эдиториал УРСС, 2001. [Электронная книга]. Вайсгербер Й. Л. Родной язык и формирование духа. М., 2004. 232 с.
  3. Гречачин, В. А. К вопросу о токенизации текста // Международный научно-исслед. журнал. 2016. №6(48). Ч. 4. С. 25-27. doi: 10.18454/IRJ.2016.48.070.
  4. Гржибовский А. М. Корреляционный анализ // Экология человека. 2008. №9 URL: https://cyberleninka.ru/article/ n/korrelyatsionnyy-analiz
  5. Кащеева А. В. Квантитативные и качественные методы исследования в прикладной лингвистике // Социально-экономические явления и процессы. 2013. №3(049). URL: https://cyberleninka.ru/article/n/kvantitativnye-i-kachestvennye-metody-issledovaniya-v-prikladnoy-lingvistike (дата обращения: 19.10.2018).
  6. Кочеткова Н. А. Статистические языковые методы. Коллокации и коллигации // Новые информационные технологии в автоматизированных системах. 2013. №16. URL: https://cyberleninka.ru/article/n/statisticheskie-yazykovye-metody-kollokatsii-i-kolligatsii.
  7. Напреенко Г. В. Идентификация текста по его авторской принадлежности на лексическом уровне (формально-колич. модель) // Вестн. Том. гос. ун-та. 2014. №379. URL: https://cyberleninka.ru/article/n/identifikatsiya-teksta-po-ego-avtorskoy-prinadlezhnosti-na-leksicheskom-urovne-formalno-kolichestvennaya-model (дата обращения: 19.10.2018).
  8. Ибрагимова В. Л., Фаткуллина Ф. Г. Основные принципы исследования словарного состава современного русского языка // Вестник БашГУ. 2010. №2. С. 320-324.
  9. Collins M. Three generative, lexicalized models for statistical parsing // In Proceedings of ACL 35. 1997.
  10. Dornyei Z. Research Methods in Applied Linguistics. OUP, 2007. [Electronic book].
  11. Diez D. M., Barr C. D., Cetinkaya-Rundel, M. OpenIntro statistics. CreateSpace, 2012. Т. 12.
  12. Harris Z. Methods in Structural Linguistics. Chicago: University of Chicago Press, 1951. [Electronic book].
  13. Jurafsky D., Martin J. H. Speech and Language Processing. NJ: Prentice Hall, 2000. [Electronic book].

Copyright © Вестник Башкирского университета 2010-2019