研究会資料‎ > ‎

第20回SWO研究会 発表募集

第20回セマンティックウェブとオントロジー研究会 Wikipediaワークショップ
日時:2009年1月22日(木)
会場:東京大学本郷キャンパス工学部2号館231号講義室(アクセス)
発表申込は締め切りました。

概要

近年,Web2.0文化の浸透に伴い,協調的にコンテンツを編集するスタイルのソーシャルメディアが発展してきました.Wikipediaはその代表例で,大量のユーザが書き込みを続けた結果,幅広い知識を網羅する大量の知識ネットワークが構築されるに至りました. 

ここ数年,各種研究分野においても新しいコーパスとしてのWikipediaに大きな注目が集まっており,WWW・自然言語処理・情報検索といった分野を中心に,関連研究が報告されてきました.さらに,AAAI,WWW,ISWCといったトップカンファレンスにおいてもWikipediaに関する論文が増え,AAAIではWikiAI,ESWCではSemWikiといった特別ワークショップが開催されてきました. 

このように世界的には多くの注目を集めているWikipediaですが,国内では様々な研究分野の研究会において,分散的に研究発表がされてきたのが現状で,Wikipedia研究について深くディスカッションする機会が十分であったとはいえません.そのため,本ワークショップでは,Wikipediaに関する研究者に対して深いディスカッションをする機会を設けるために,Wikipediaの研究を一堂に集め,集中的に議論することを目的としています.多くの方々がご発表,ご参加され,有益な議論と情報交換が行われることを期待しております.

トピック
  • Wikipediaからの情報抽出
    • 関連・関係抽出,意味抽出,オントロジ・シソーラス構築
  • Wikipedia記事の信頼性評価
  • Wikipediaの統計報告
  • WikipediaとセマンティックWeb
  • Wikipediaと自然言語処理
  • Wikipediaと多言語解析,翻訳辞書構築
  • そのほかWikipediaを利用した各種研究
  • 情報検索,対話処理,コンテキスト解析など

チュートリアル

Wikipediaマイニングチュートリアル~Wikipediaマイニングの勘どころ~
中山浩太郎(東京大学) 

目的
Wikipediaのコーパスとしての有用性は,ここ数年でNLP,AI,Semantic Web,IRなど各種の研究分野で広く認識されるに至りました.しかし,Wikipediaを解析するためには,大規模データの取り扱い方法や,データベースの有効な利用方法,ノイズデータの除去など,いくつかのポイントがあり,これらのポイントをクリアしなければ,解析が困難である上に精度低下の要因にもなります.
そこで,本チュートリアルでは,これからWikipediaマイニングを始めようという方,はじめたばかりの方たちの間で情報を共有することを目的とし,ケーススタディとして,講演者の経験からいくつかポイントと思うポイントを提示します.最後にディスカッションの時間を設けて,より良い方法論を模索したいと思います. 

アジェンダ
  • Wikipedia研究の要点
  • mwdumper
  • データベースの扱い
    • インデックス
    • ストアドプロシージャの勧め
  • Wikipedia解析の定石
    • ノイズデータの除去
    • リダイレクトページのリンクを伝搬
    • アンカーテキスト解析
  • 大規模リンク解析
  • ディスカッション

発表申込・原稿提出

発表申込(締切:2008年12月22日(月))
以下の発表申し込みフォームにご記入の上,sigswo {at} nii.ac.jp 宛てにご送付ください.

原稿提出(締切: 2009年1月15日(木))
お申込み頂いた順番にページ番号をお知らせしますので,ページ番号を付記した原稿(A4,2~10頁,PDFファイル)を作成し,上記のアドレス宛てにご送付ください.原稿作成には人工知能学会研究会スタイルファイル/Wordテンプレートをご利用ください.

原稿は研究会のページ に掲載します(研究会資料の冊子は作成しておりません).なお,原稿のWeb公開に際して配慮が必要な場合(知財権のある場合など)は発表申込み時にその旨お知らせください.

========発表申し込みフォーム========
研究会:第20回SWO研究会:Wikipediaワークショップ(2009年1月22日開催)
申込締切:2008年12月22日(月)
送付先:sigswo {at} nii.ac.jp

タイトル:
著者(発表者に○):
所属:
概要(数行で):
著者連絡先Email:

発表希望時間(以下の3つから1つ)を選び,他を削除してください。
15分(発表10分・質疑5分)
25分(発表15分・質疑10分)
35分(発表20分・質疑15分)
========発表申し込みフォーム(終わり)========

お問い合わせ先

福原知宏 (東京大学人工物工学研究センター)
E-mail: fukuhara {at} race.u-tokyo.ac.jp