Elasticsearchの日本語の形態素解析は基本的にkuromojiを使うのですが、けっこうよく出来てて「え?これまで拾っちゃう?」って思うこともしばしば。 かすってそうなデータも拾ってくれるのはありがたいのですが、 …
[続きをもっと見る…]
Elasticserchの検索で余計なノイズを載せないようにしたい
2014-01-09
Elasticsearchの日本語の形態素解析は基本的にkuromojiを使うのですが、けっこうよく出来てて「え?これまで拾っちゃう?」って思うこともしばしば。 かすってそうなデータも拾ってくれるのはありがたいのですが、 …
[続きをもっと見る…]
前回に引き続きPython初心者シリーズ みずほのサイトからロト7の当選番号をすっぱ抜いてくるサンプルを紹介します。 スクレイピング PHPでスクレイピングをやろうとすると、curlで取ったHTMLをpreg_match …
[続きをもっと見る…]
バツイチちゃんがSolrのこと書いてたので、インケンはElasticsearchのこと書きます。 xmlよりjson派なインケンとしてはsolrなんかより、elasticsearch押しです。solr使ったことないけどね …
[続きをもっと見る…]
はじめに Pythonまったく使ったことないから、Pythonでなんか作ってみようと思ったのがきっかけです。 かといって、「Hello World」出すだけなんてしょーもないことしても意味が無いので、ちゃんとフレームワー …
[続きをもっと見る…]
こんにちわ、インケンです。 これからはインケンもたまに書きます。