компьютерная лингвистика:методы, ресурсы,приложения

PPT 28 sahifa 3,4 MB Bepul yuklash

Sahifa ko'rinishi (5 sahifa)

Pastga aylantiring 👇
1 / 28
компьютерная лингвистика: методы, ресурсы, приложения компьютерная лингвистика: методы, ресурсы, приложения * * содержание компьютерная лингвистика: истоки задачи компьютерной лингвистики (кл) особенности естественного языка моделирование в кл лингвистические ресурсы прикладные задачи кл * * компьютерная лингвистика: истоки междисциплинарная область: обработка ея автоматическая обработка тестов на ея машинная /инженерная лингвистика вычислительная/ компьютерная лингвистика смежные области исследований лингвистика фонология (звуки речи) морфология (структура и форма слов ея) синтаксис (структура и функции предложений) семантика и прагматика (смысл и значение высказываний) лексикография (описание лексикона ея) психолингвистика математика информатика (computer science) искусственный интеллект * кл, математика и искусственный интелект математика математическая лингвистика порождающие (формальные) грамматики - н. хомский квантитативная лингвистика искусственный интеллект (ии) задача – компьютерные модели интеллектуальных функций часть computer science, пересечение (по задачам и методам) с кл первая известная работающая программа ии по обработке ея – система т. винограда (70-е годы); пример диалога с системой: pick up a big red block. (человек) ok is …
2 / 28
я: уровни и подуровни синтаксический (предложения ея) подуровень словосочетаний (увидел лес, красивый закат) надуровень сверхфразовых единств (сложных синт. целых ≈ абзацев), объединяющихся по смыслу и лексико-грамматически (повторы слов, анафорические ссылки) морфологический (слова ея, словоформы) подуровень морфем; морфема – минимальная значимая часть слова (корень, приставка, суффикс…) фонологический (звуки / символы) ? уровни/ срезы ? семантический - набор элементарных единиц – сем лексический: лексема – совокупность словоформ слова (конь, коня, коню, коне) дискурсивный (связный текст) – схематические структуры текстов (патентные формулы, деловые письма и т.п.) * ея и искусственные языки * искуств. языки, например: языки программирования близки по функциям, но принципиальные отличия: открытость и изменчивость ея (на всех уровнях)  невозможность единожды разработать лингв. процессор нестандартная сочетаемость (синтактика) единиц ея на всех уровнях, например, лексическая сочетаемость: крепкий чай, но не тяжелый чай (heavy tea) большая системность (число уровней) и степень ассиметрии связи единиц и выражаемых ими смыслов полисемия (многозначность) синонимия (совпадение смыслов) …
3 / 28
писание свойств обрабатываемого текста. особенности моделей кл: формальность и алгоритмизируемость; функциональность: цель – воспроизведение функций языка как «черного ящика», а не моделирование языковой деятельности человека; общность модели, т.е. покрытие ею довольно большого множества текстов; экспериментальная обоснованность, предполагающая тестирование модели опора на те или иные словари как обязательную составляющую модели. модульность лингв. процесоров * сложность ея  лингвистический процессор – многоэтапный преобразователь анализ текста: первичный модуль – графематический анализ синтез теста: другое направление обработки виды и особенности моделей в зависимости от учета уровней ея: структурные (несколько уровней) редуцированные - статистическая модель : статистика символов/букв, их биграмм и триграмм (уровень символов) или слов, их биграмм и триграмм структурно-статистические на разных уровнях ея: модели морфологии (анализ: лемма или основа с морфологическими характеристиками исходной словоформы) модели синтаксиса, анализ: синтаксическое дерево: - деревья непосредственно составляющих (валентности слов, например: передать - кто? кому? что? – subcategorization frame) - деревья зависимостей (валентности – модели управления слов) модели …
4 / 28
ей языка (синтаксис: модели управления слов, описывающие их синтаксические и семантические валентности ); семантическое представление текста: семантический граф + коммуникативная организация смысла лингвистические ресурсы лингвистические процессоры базируются на определенном представлении лингвистической информации: компьютерные словари грамматики ея базы словосочетаний тезаурусы и онтологии коллекции и корпуса текстов * лингвистические ресурсы: словари и грамматики словари для лп обычно разрабатываются специально . различаются: охватом лексики: общая/специальная представленной информацией (в словарной статье): - морфологические словари - словари моделей управления видом: - словари синонимов: - словари паронимов: чужой и чуждый, правка и справка - словари терминов некоторой предметной области грамматики – набор правил, описывающих структуру предложений: пример: subject|gender 1 ^, number 1 ^, case 1 ^| | | * лингвистические ресурсы: базы словосочетаний сравнительно новый тип лексического ресурса, отражает стандартную и нестандартную сочетаемость слов ея обширная база словосочетаний ря – система кросслексика примерно миллион словосочетаний общей лексики словосочетания многих синтаксических типов: - определяемое слово  определитель …
5 / 28
понятий, сущностей wordnet – лингвистическая онтология на базе английских слов - дж. миллер, 1984 г., модель человеческой памяти - слова разбиты по частям речи - для слов каждой части речи выделены синсеты – наборы синонимов - версия 3.0 – 155 тыс. лексем, 117 тыс синсетов (понятий) euronet – аналогичные лексические ресурсы для других европейских языков * * лингвистические ресурсы: корпуса текстов трудоемкость создания лингвистических процессоров и лексических ресурсов  автоматизация их построения * коллекция текстов: представительный набор текстов, собранных по определенному принципу корпус текстов: коллекция текстов с лингвистической разметкой: морфологической, лексической, синтаксической, дискурсивной - использование в лингвистических исследованиях - применение для машинного обучения моделей - для ря – национальный корпус русского языка интернет-корпус: тексты сети интернет как корпус современной речи прикладные задачи кл машинный перевод информационный поиск классификация и кластеризация текстов реферирования и аннотирование текстов формирование ответов на вопросы автоматизация подготовки и редактирования текстов извлечение информации из текстов генерация текстов …

Ko'proq o'qimoqchimisiz?

Barcha 28 sahifani Telegram orqali bepul yuklab oling.

To'liq faylni yuklab olish

"компьютерная лингвистика:методы, ресурсы,приложения" haqida

компьютерная лингвистика: методы, ресурсы, приложения компьютерная лингвистика: методы, ресурсы, приложения * * содержание компьютерная лингвистика: истоки задачи компьютерной лингвистики (кл) особенности естественного языка моделирование в кл лингвистические ресурсы прикладные задачи кл * * компьютерная лингвистика: истоки междисциплинарная область: обработка ея автоматическая обработка тестов на ея машинная /инженерная лингвистика вычислительная/ компьютерная лингвистика смежные области исследований лингвистика фонология (звуки речи) морфология (структура и форма слов ея) синтаксис (структура и функции предложений) семантика и прагматика (смысл и значение высказываний) лексикография (описание лексикона ея) психолингвистика математика информатика (computer science) искусственный интеллект...

Bu fayl PPT formatida 28 sahifadan iborat (3,4 MB). "компьютерная лингвистика:методы, ресурсы,приложения"ni yuklab olish uchun chap tomondagi Telegram tugmasini bosing.

Teglar: компьютерная лингвистика:методы… PPT 28 sahifa Bepul yuklash Telegram