Networkxをつかってグラフを描く

Wikipediaのカテゴリ間のネットワークを見てみたくて、Networkxというpythonのライブラリをつかってグラフを描きました。例えばWikipediaの「ヒップホップ」というページは

  • ヒップホップ
  • ヒップホップ用語
  • アメリカ合衆国の音楽
  • サブカルチャー
  • 風俗
  • アフリカ系アメリカ人の文化
  • というカテゴリに登録されています。これらのカテゴリがそれぞれ所属するカテゴリをさらに辿ってそれらの関係を視覚化すると下の図のようになります。(この図では3階層上のカテゴリまで)

    日本語をグラフに描画するのに苦労しました。とにかく描ければよいということで適当なパッチを作って対応しています。
    patch for networkx1.5 https://gist.github.com/1247256

    Screen shot 2011-10-01 at 2.00.25 AM

    Learning to Link with Wikipedia
    http://www.cs.waikato.ac.nz/~dnk2/publications/CIKM08-LearningToLinkWithWikipedia.pdf

    Posted: September 30th, 2011 | Author: | Filed under: 技術 | Tags: , , , | No Comments »