自然言語処理に関する用語の具体的内容、及びその有効性について、また、各処理段階における基本的な表現法やアルゴリズムについて説明できる。
概要:
我々が日常使用する言葉(日本語や英語)は、プログラミング言語(C言語等)の人工言語と対比して、自然言語と呼ばれている。本講義では、自然言語処理の基本的段階である形態素解析、構文解析、意味解析に関する基本事項を学ぶ。また、現代的な統計的言語処理の基礎についても学ぶ。
授業の進め方・方法:
各自の担当箇所を割当て、輪講形式で授業を進める。輪講で用いたレジュメはコメントを反映して次回の授業までに提出する。
注意点:
輪講形式で授業をすすめるため、事前の予習を確実に受講者が予習しておくことが必須である。
|
|
週 |
授業内容 |
週ごとの到達目標 |
後期 |
3rdQ |
1週 |
自然言語処理の概要 |
授業の進め方を説明し、自然言語処理とは何か、自然言語処理の歴史について学ぶ。
|
2週 |
統計的言語処理入門 |
自然言語の数学的表現方法について学び、naive Bayes法をもとに統計的な言語処理の考え方を習得する。
|
3週 |
言語の統計 |
言語の統計、統計の取り方、ジップの法則、マルコフ・モデル、シャノンの理論、テキスト間の類似性の検出などについて学ぶ。
|
4週 |
言語の有限オートマトンモデル |
言語の基本的概念、単語の性質、有限オートマトン、正規言語、及びオートマトンと言語の関係などについて学ぶ。
|
5週 |
文脈自由型言語 |
形式文法、文脈自由型句構造言語、その性質、プッシュダウンオートマトン、オートマトンと言語の関係について学ぶ。
|
6週 |
記号論理と言語 |
記号論理、記号論理式の意味と文の意味について学ぶ。
|
7週 |
形態素と形態素解析(1) |
形態素解析とは? 形態素や語の定義などについて学ぶ。
|
8週 |
形態素と形態素解析(2) |
形態素解析のアルゴリズムについて学ぶ。
|
4thQ |
9週 |
構文解析(文脈自由文法に基づく構文解析I) |
構文解析とは?。自然言語の文法をより自然に表現できるように前終端記号を導入した文脈自由文法を定義し、それに基づく構文解析アルゴリズムについて学ぶ。
|
10週 |
構文解析(文脈自由文法に基づく構文解析II) |
文脈自由文法に基づく各種構文解析アルゴリズムについて学ぶ。
|
11週 |
構文解析(文脈自由文法の拡張) |
実用規模の自然言語の文法を文脈自由文法として記述することは規則の数が膨大になり、文法の見通しを著しく低下させる。文法の見通しが悪くならないように文脈自由文法を拡張した文法記述法について学ぶ。
|
12週 |
構文解析(構文解析における優先規則) |
入力文の構造を一意に決定せず、可能な解に優先順位付けを行ったりして、ある程度の精度で一意の解を求める。そのときの優先順位について学ぶ。
|
13週 |
意味解析 |
文の意味解析とは何かという問題について学ぶ。意味的あいまい性の解消を選択制限、連想関係に基づく方法について学ぶ。
|
14週 |
自然言語処理の応用システム |
自然言語処理技術を用いた応用システムの事例について学ぶ。
|
15週 |
試験 |
講義で学んだ内容の理解度を問う。
|
16週 |
まとめ |
答案の返却、解説を行う。
|
分類 | 分野 | 学習内容 | 学習内容の到達目標 | 到達レベル | 授業週 |
専門的能力 | 分野別の専門工学 | 情報系分野 | システムプログラム | コンピュータシステムにおけるオペレーティングシステムの位置づけを説明できる。 | 4 | |
プロセス管理やスケジューリングなどCPUの仮想化について説明できる。 | 4 | |
形式言語の概念について説明できる。 | 5 | |
オートマトンの概念について説明できる。 | 5 | |
コンパイラの役割と仕組みについて説明できる。 | 5 | |
その他の学習内容 | 少なくとも一つの具体的なコンピュータシステムについて、起動・終了やファイル操作など、基本的操作が行える。 | 5 | |
少なくとも一つの具体的なオフィススイート等を使って、文書作成や図表作成ができ、報告書やプレゼンテーション資料を作成できる。 | 5 | |
少なくとも一つのメールツールとWebブラウザを使って、メールの送受信とWebブラウジングを行うことができる。 | 5 | |
コンピュータウィルスやフィッシングなど、コンピュータを扱っている際に遭遇しうる代表的な脅威について説明できる。 | 3 | |
コンピュータを扱っている際に遭遇しうる脅威に対する対策例について説明できる。 | 3 | |
データモデル、データベース設計法に関する基本的な概念を説明できる。 | 4 | |
データベース言語を用いて基本的なデータ問合わせを記述できる。 | 4 | |
メディア情報の主要な表現形式や処理技法について説明できる。 | 4 | |