遅い→起動時

http://d.hatena.ne.jp/pmint/

2012-10-12から1日間の記事一覧

ゼロから作る単語辞書 (0)

文章間の共通点を集めて、日本語の文章から単語抽出。 diffで得た共通点とその出現数を元にして、多数の文章に現れる文字列ほど単語として使える文字列ということにしてみる。 テキストを2つ用意 diff 共通点を記録 同じ共通点が見つかるたびに出現数+1 出現…