« どうやら80番を開けてもらった模様 | メイン | 世界一厳しい日本の音楽規制 »

July 28, 2004

自然言語処理ことはじめ


荒木健治著『自然言語処理ことはじめ―言葉を覚え会話のできるコンピュータ』

マイクロアレイにように生物学の実験データがハイスループットで作り出されるようになった一方で、その膨大なデータの海から、いかにして意味のある情報を抽出するかが問題になっている。そこで、これまでに蓄積されてきた文献情報などから、遺伝子の制御関係や生体分子の相互作用などの知識を、コンピュータを使って自動で抽出・整理する為のデータマイニング技術が注目されるようになった。実際、そうした機能を謳った製品が、多くのベンダーから発売されているが、満足のできるモノは今のところ極めて少ないのが現状だ。

先日参加してきた「バイオインフォマティクス夏の学校in輪島」でも、生物学的知識をいかにしてコンピュータで扱うかと言う講演が多かった。その中に「自然言語処理」の話題もあったのだけど、生物系のオイラには理解不能だったので、上記の入門書を手にしてみた。

ちなみに「自然言語」とは、英語や日本語のように文化的な背景を持って発達した言語のことを言う。プログラム言語などは「人工言語」と読んだりするが、「人工言語」がコンピュータで扱いやすいように文法や語彙の意味が厳密に定義されているのに対して、「自然言語」は文法や語彙の意味が非常に曖昧であり、コンピュータにはとっても扱いにくい。「自然言語処理」とは、このコンピュータで扱いにくい「自然言語」を、何とかしてコンピュータで扱えるようにするための技術であり、これまで、主に人工知能や自動翻訳などの分野で研究されてきた。生物学の文献情報は、もちろん「自然言語」(主に英語)でかかれたものであるので、この「自然言語処理」を用いて文献の意味を網羅的に解析しようとする試みがなされているようだ。

投稿者 blog@tsukuba : July 28, 2004 09:52 PM

トラックバック

このエントリーのトラックバックURL:
http://tetralog.in/mt/mt-tb.cgi/17

このリストは、次のエントリーを参照しています: 自然言語処理ことはじめ:

» [work] 金曜日は from chalk-less::weblog::thecla
つくば に行きますので、よろしかったら。 [続きを読む]

トラックバック時刻: July 29, 2004 12:44 AM

コメント

関連する書籍