読者です 読者をやめる 読者になる 読者になる

F25

文面の分析で人物像を割り出す

f:id:miss_j:20160901011802j:plain

今、たくさんの研究者が、コンピュータに自然言語を理解させようと奮闘している。コンピュータと人間が会話をする時代。SiriやWatsonを見ていると、そんなに遠くないのではと感じてしまう。しかし、完璧に文章を理解するには、もう少し時間がかかるようだ。


では、その過程の段階として、文章の表面的な分析結果を何かに活用できないのだろうか。 文章の意味はわからなくても、それを書いた人がどのような人かを割り出してみることはできそうな気がする。


文章を書くとき、少なからずその人の個性が出る。0からは何もアウトプットできないので、その人のバックボーンや価値観が反映されやすいのだろう。

例えば…受け入りの知識なのだが、男女の書く文章には違いがあるらしい。

男性の書く文章は、端的で直接的であることが多い。いきなり本題に入り、要件のみ簡潔に伝えるような文だ。そして、「僕が〜」のように、自分が主語になる文章を書いたり、断定的な言い回しを使うことが多い傾向にあるそうだ。

一方、女性はもっと細かい描写や表現を好む。形容詞を多く使ったり、内面や感情的な部分を描いたり。本筋とは関係ない話を盛り込んだりするのも女性の特徴だそうだ。

そういった特徴を、テキスト全体から割り出して分析し、その文を書いたのが、男女どちらの可能性が高いか、割り出すのだ。

加えて、ある特定の年代の人しか知らないワードや、地域特有の言い回しなどを検出することで、大まかな人物像を導き出すことができるのではないか。


例えば、私の場合でいうと、「青いベンチ」や「放課後」だ。

「昔、放課後にみんなで青いベンチを聞きました。その頃は、毎日がキラキラと輝いていて、とても楽しかったと思います。」

なんていう文があったら、高い確率(?)で20代・東海地方出身の女性、と割り出せそうだ。


このように、コンピュータが文章自体を完璧に理解できなくても、文面を分析することによって、ある程度の人物像を割り出すことができるのではないか。
 実際、FBIでは、書かれた文章の特徴を分析することによって、どのような人物なのかプロファイルをすることがあるそうだ。知識を持ったベテランの捜査官が頭の中で行うことが、誰でもできるようになるメリットは大きいと思う。


このような技術が活用できるとすれば、警察の捜査だろうか。
テキストの分析に加えて、筆跡や筆圧等の分析も組み合わせられると、書いた人の人物像や、精神状態の分析の精度がより上がりそうだ。

また、一般企業においても活用できるのではないかと思った。自由回答欄がある場合に限るが、アンケートなどの分析に使える。商品に対して、こういう評価をしているのは、こういう人物だ、とか、クレームを言う人は、こういう人物だ、とか。

その他、企業の採用の場面でも使えるかもしれないし、占いでも使えるし…。

そんなに需要がなさそうだな、という感じが否めないが、刑事ドラマファンとしては、ぜひ実用化して(試させて)ほしい。