バーチャルオフィスのinsquare|TOP > インスクエアメルマガ バックナンバー


TOP >> ;Archive: 07. 4月 2017

『Watsonコーパス』 インスクエア ビジネスニュース Vol.1252

■[ インスクエア ビジネスニュース ]━■

 エイジレスな起業支援
 インスクエアが送る【最新!ビジネス情報】
 http://in-sq.com
■━━━━━━[vol.1252] 2017/04/07━━■

メルマガ無料購読申込はこちら

━━┳━━━━━━━━━━━━━━━━━━━━━━
01 ┃ 本日のコラム -『 Watsonコーパス 』
━━┃…………………………………………………………
  ┃ / 藤田 幹夫(PDBマーケティング株式会社)
━━━━━━━━━━━━━━━━━━━━━━━━━
PDBマーケティング藤田です。
金曜日はAPIエコノミー活動記録を、準リアルタイムで
お伝えしています。

今日のテーマは「コーパス」。聞きなれない言葉です。
IBMの人工知能Watsonを付けました。
IBMはコグニティブと表現するのですが、以下AIと総称します。
コーパスは、AIを自然言語で利用するときに登場してきます。

まず定義です。
国立国語研究所という機関があります。
大学共同利用機関法人です。
日本で一番正しい定義ができる機関。定義は以下の通りです。
言語を分析するための基礎資料として,書き言葉や話し言葉の
資料を体系的に収集し,研究用の情報を付与したもの。

言語を研究するために、膨大な文書を集めて分析=ばらばらに
分解して、法則性を見つけて再構築。
という、気が遠くなるような作業を延々とやって作り上げるもの。

すでに、いくつかの実績も公開されています。

https://www.ninjal.ac.jp/database/type/corpora/

AIで自然言語を扱うには、辞書を内包したコーパスは必須です。
辞書が単語の対照表、コーパスは文法、文例的な位置になります。
Watsonが有名になったのは、アメリカのクイズ番組で人の
クイズ王に勝ったことです。

冷静に考えると、クイズの会話は非常に限定的です。
「リンゴの産地はどこ?」「初代の大統領は?」短文で、
文意も明らかです。
データの記憶はコンピュータは得意ですから、検索を
工夫することで、人の能力を超えました。

AIは今、現実のビジネスの領域に入ろうとしています。
ここではクイズ番組のような単純なコミュニケーションでは
対応ができません。
より強力、複雑なコミュニケーションには、対象領域に特化した
コーパスが必要となります。

新しい技術が断片的なデモの段階から、世の中を変えていく
ために超える壁です。かなりむつかしい。
IBMはコーパスをWatsonで作成することを考え、コーパス
作成ツールの提供を開始しました。

Watson Knowledge Studio(WKS)です。
あわせて、コーパス提供パートナー募集を開始。
いよいよ、コンテンツが主導する時代に入ります。

早速、2回のセミナー、Webセミナーを2回受講、
チュートリアルでの確認を行いました。
結果は?
残念ながら、作成過程が期待と異なっていました。

AIを実務適用するには、コンテンツ必須という理解は
定着したようですが、個別課題へのアプローチは異なります。
というよりもまだ技術的な深化が、そこまで至っていない。
人の判断が介在すると簡単なことでも、自動的な判断は
困難なことがたくさんあります。

今回、IBMが提供開始したツールWKSは通常文書を対象に、
会社を含む組織名、人名、商品を自動識別し、
その関係=勤務している、所有している、といったそれぞれの
関係を定義します。

そのためには「教師データ」と呼ばれるお手本をマニュアル
で入力します。
このお手本を機械学習して、モデルを作成後、膨大なデータを
自動識別する仕組みです。

会社情報への適用の壁。
1.別途辞書化が終了した情報の活用ができない。
すでに30万社の情報を名称、属性、活動として構造化した
データとして保有しています。
WKSは新規定義のみで、外部定義データを活用する仕組みがない。

2.同一社名への対応策がない
同じ文字列を、異なった対象として扱う仕組みがない。
したがって、同一社名は同じ会社として扱ってします。

コーパス構築への辞書としての提供を含めて期待したのですが、
現実的ではありませんでした。
あきらめないで、コーパスを使った領域の拡大と、より精度への
ニーズの高まりに期待します。

コンテンツの時代はもうすぐですが、いまではないのが現実です。
APIとAI適用領域開拓を焦らないで継続します。

—————————————————————-
▼プロフィール:インスクエアメルマガ編集委員、営業支援担当、起業塾

・氏名:藤田 幹夫(ふじた・みきお)65歳
・出身:香川県丸亀市
・出身高校/大学:香川県立丸亀高校/京都大学理学部
・役職:PDBマーケティング 代表取締役
 知恵と工夫で、『APIエコノミー』を追求します。
・mail:fujita@p-db-m.com
・経歴:1974年 株式会社日本ビジネスコンサルタント 入社
    1987年 兼(財)データベース白書編集委員2008年廃刊まで
    2009年 PDBマーケティング株式会社代表就任(現在に至る)
—————————————————————-


« 3月 2017 4月 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 5月 »