修士論文

ネット小説の印象を自動推定(自動分類)する。

すでに1月末に提出済みですが,ようやく承認も得られたのでさっそくblogにはupしてしまいます。いずれ論文投稿したら削除するかもしれませんが…。http://www.slis.keio.ac.jp/~koki.h/search-by-emotion.pdf :『機械学習手法を応用したネット小説の「印象」…

小説の雰囲気とは

いまさらながら,色々な人が色々な概念を指して,雰囲気や印象という用語を使っているようです。今のところ分かっているのは, 1.文体的な意味での「雰囲気」 ex.村上春樹のような書きぶりの小説とか,特定の作家,作品の持つテクスト的な側面に着目 2.読後…

wekaの分類が,どのクラスにどの程度の確率によって確定したか知りたい

タイトル長いですが,ようは多クラス分類を考えるとき,1事例1クラスだけじゃなく,1事例多クラスの分類をしたいときなどにはどうするのかってことですね。Naive Bayesは,どのくらいの確率で特定のクラスに分類されるかってことを計算しているので,その確…

weka

wekaに実装されているいくつかの判別器を実行すると、メモリー不足から実行が停止してしまうことがしばしば。そこでJVMのメモリー使用可能域を増やそうと思い、色々調べましたが、日本語ではなかなか見つかりません。RunWeka.iniの35行目付近、maxheapを指定…

WEKA

修論での機械学習にはwekaを使おうと思っていたんですが(学習プログラム書けませんし)、javaのプログラムから利用できるということで、そうしようかなと思いつつ、使い方分からんって感じで悶々としてました。そんなとき、wekaのソースの中にstringtowprdv…

sen3

またまたsenについて。いやはや、senで形態素解析をかけたいファイルを読み込み、それを解析し、違うファイルに出力するということをしたいだけで、めっちゃ時間かかってしまいました。まぁ、試行錯誤が一番近道だと思って、めげずにがんばりますよ。で、色…

sen 2

senについてまた備忘録。コマンドプロンプトでは動くのに、netbeansでは動かし方が分からないと、初心者っぷりを発揮して、迷走していました。(eclipseではない理由は、単に教授がnetbeansを使っているから。その方が指導を受けやすいので。)ずーっと、imp…

sen

修士論文で、「小説の雰囲気を自動的に推定(分類)しよう」なんてことをやっているもので、いろいろとデータ準備のプログラムを作っています。といっても、最初から理工系の情報学を勉強しているわけでもないので、なかなかの苦戦ぶりですが。javaを使って…

はじめて知りましたが

計量文献学、計量文体学というものがもうかなり前からあるんですね。村上征勝さんという同志社大学の教授が日蓮の三大秘法禀承事が真作であることや源氏物語の宇治十帖が違う作者であることを数量的な分析からつきとめるというのはとても面白いと思いました…

ボクはある本屋でアルバイトをしているのですが、社員さんと夜ご飯をご一緒させてもらったときに、「この小説と同じような世界観の小説を紹介してほしい」という問い合わせが少なくないというお話を聞きました。ボクは情報検索を専門(まだまだ未熟過ぎであ…