言語グリッドとは

概要

NICTと大学,NTTなどの研究グループは,産官学民の体制で,インターネット上の多言語サービス基盤「言語グリッド(Language Grid)」の開発に着手しました.2006年度より3年間を目処に実用化を進めます.言語グリッドが開発された場合の,ユーザのメリットは以下のとおりです.

  • インターネット上の言語資源(対訳辞書など)や言語処理機能(機械翻訳など)を自由に組み合わせて使うことができます.
  • 自分たちのコミュニティが作った言語資源を追加し,自分たちの活動のための言語サービスを容易に作り出すことができます.例えば,国内外で異文化コラボレーション活動を展開するNPOなどが,活動に必要な多言語サービスを自ら開発することが可能となります.

言語グリッドはWebと似ています.Webによって世界のコンテンツが繋がり,世界中の人々がコンテンツを作り始めたように,言語グリッドによって世界の言語が繋がれば, 世界中の人々が自分たちの力で言語サービスを生み出すようになると考えています.

言語グリッドを実現する基本ソフトウェアはNICTで研究開発し公開していきます.一方,言語グリッドの運営は,京都大学情報学研究科社会情報学専攻が運営組織となって, 非営利利用を対象に進められています.また言語グリッドの利用経験は,言語グリッドアソシエーションに集まるNPO,NGO,大学などのユーザグループによって蓄積されています.

詳しくは, 京都大学が運営する言語グリッドオペレーションセンター, ユーザグループが集まる言語グリッドアソシエーションのWebサイトをご覧ください.


(707KB)

(613KB)
言語グリッド -世界の言語サービスを連携し,異文化コラボレーション活動を支援

(696KB)

(1.38MB)
言語グリッドのサービス

(1.12MB)

(3.64MB)
言語グリッドを用いた国際交流・多文化共生活動の支援

(487KB)
言語グリッド パンフレット

(1.16MB)
言語グリッドの資源管理と活用例

言語グリッドの背景

インターネットは人々を繋いだと言われますが,言語の壁はなお厚く,思考の世界は未だ繋がれていません. 加えて,インターネットの言語人口は多様化し,標準言語がなくなってきています.英語人口は35%程度で,残りは英語以外の欧州言語とアジア言語が半々です. そのためインターネットから情報を得るには多くの言語を理解する必要がありますが,機械翻訳の品質には未だ十分ではありません. 世界の人々のコラボレーション基盤を生み出すためには,言語の壁を越える必要があります.本プロジェクトが進める言語バリア克服の方法は以下のとおりです.

  • 既に世の中には,専門家が開発した多くの言語サービスがあります.それを言語グリッドがインターネット上で連携させます.
  • 人々が,言語グリッドに自分たちの言語資源を追加し,言語グリッドの提供する支援系を用いて,自分たちのための言語サービスを開発して行きます.

言語グリッドは,専門家だけの力ではなく,多くの人々の力を集めて言語の壁を越える試みです.

言語グリッドの役割

既にインターネットには,電子辞書などの言語資源や,機械翻訳などの言語処理機能が蓄積され始めています. では,国際的な異文化コラボレーション活動の現場で,ユーザはそうしたサービスが利用できるでしょうか? 言語サービスの利用には,様々な困難があります.

  • 言語サービスの費用は,機械翻訳システムでは言語対あたり年間100万円程度,対訳辞書では言語あたり10万円程度が必要です.世界の言語をカバーするには多くの予算を必要とします.
  • 言語サービスは契約や知財が複雑,また利用方法が標準化されていないなど,ユーザが利用するのは容易でありません.

言語グリッドの目標は,インターネット上の言語インフラとなることです.言語サービスのアクセシビリティとユーザビリティを向上させ, ユーザが,活動に必要な言語サービスを自ら構築することを可能とします.

言語グリッドの機能

一般にグリッドは,「分散した資源を連携させ,オープンスタンダードなプロトコルが利用でき,質の高いサービスを提供できるもの」と定義されています. 言語グリッドは,インターネット上の言語サービスを自由に組み合わせ,新たな言語サービスを産み出す枠組みです.言語サービスに関するグリッドは,この提案が世界で初めてです. 言語グリッドには,以下の2つの機能があります.

  • 「水平型言語グリッド」は,対訳辞書や機械翻訳などを縦横に組み合わせます.
  • 「垂直型言語グリッド」は,応用に特化し現場が必要とする言語サービスを生み出します.

水平型言語グリッドは,アジアの10 言語程度の対訳辞書や機械翻訳を利用可能とすると共に,欧州の研究機関と連携し世界全体で20言語程度をカバーします. 垂直型言語グリッドは,医療通訳,絵文字コミュニケーションなどの様々な異文化コラボレーション活動のための辞書や用例対訳を利用可能とします.

言語グリッドの技術

言語資源や言語処理機能を連携させるために,セマンティックWebの技術が用いられます.ここで言語資源は,対訳辞書,シソーラス,コーパスなどを, 言語処理機能は,言語の解析や,翻訳,言い換えなどを意味します.特に以下の技術開発を進めます.

  • 言語サービスオントロジは,言語サービスの利用方法を標準的に記述する技術です.言語グリッドプロジェクトでは,欧州の研究機関と協力し標準仕様の研究を進めます.
  • セマンティックWebサービスは,利用方法が標準的に記述されたWebサービスを,インターネットに接続されたクライアントから利用可能とする技術です.言語グリッドプロジェクトでは,複合サービスのベストプラクティスを蓄積し再利用します.

言語サービスオントロジとセマンティックWebサービスの研究により,世界各地で開発された対訳辞書や機械翻訳などが利用可能となります. また,複合サービスを容易に実現できます.例えば,複合サービス(日独翻訳)を実現するには,基本サービス(日英翻訳と英独翻訳)を組み合わせます.

言語グリッドの研究体制

言語グリッドプロジェクトは,2005年より京都大学などの大学研究者を中心に検討を進めてきました.2006年4月から,ユニバーサル・コミュニケーション技術戦略の一環として, NICT知識創成コミュニケーション研究センターで本格的に始動します. このプロジェクトの特徴は,産官学民が協力することです.即ち,NICT,大学,企業の研究者と,NPOの活動家の協働による参加型の研究開発が行われます. このため,言語グリッドアソシエーションを設立しました.

産官学民による実証実験とビジネスモデル形成の場として活用します.以下に例をあげます.

  • 医療支援現場では,専門家が記述した用例対訳と,現場で作成した用例対訳を組み合わせて,通訳ボランティア活動の支援を行います.
  • 子供たちのコミュニケーション現場では,活動をサポートするボランティアスタッフ(日本,韓国,オーストリア)のコミュニケーションの支援を行います.
  • 防災教育ネットワークの現場では,多国間の子どもたちのコミュニケーション活動の支援を行います.