ここでは、IMCの開発話や将来構想について書きつずって行きます。
~2014年
IMCの作者であるRedは、インターネットが今の様に世間一般に広まる前から、ネットにどっぷりはまっており、OS/2(このOSを使ったことがある方は相当な年配ですね)を使い、9600bpsの回線で某プロバイダーにダイアルアップして、ニュースグループ(皆さん知らないですよねNNTP)から、主に画像を得ていました。
当時、Webサイトの数も限られており、中身も文書が主体で、画像が載っていたサイトもPlayboy等限られていました。Playboyの月一更新が待ちどうしかったな~ぁ
Redは当時、SEをやっていませんでしたが、会社で日本製OSのしたプログラム開発は行っていました。作ったプログラムはIMCに比べようもないほど小規模でしたが業務に使用してもらえました。(フロッピディスクで、全てをこなしてましたね。)
そんな、時を経てインターネットからダウンロードした画像ファイルは日々増大を続け、2014年当時で100万枚に近づいていました。
100万枚の画像ですが、同一画像、類似画像が溢れかえっていました。とある類似画像の検出ソフトを使っては見ましたが、比較の度に画像を再スキャンしなければならないし、比較範囲は単一ディレクトリのみ、類似画像が横並びで表示されるのですが、どこが違うのか、さっぱり判別できない。
さらに、似ても似つかない画像を類似画像として検出しまくりで、とても使えるものでは有りませんでした。まぁフリーソフトの限界ってあきらめておりました。
でも、日々画像ファイルは増え続けて行き、120GBのSCSI-2接続の速くもない外付けHDDを10万円近くはたき2台買って、正副運用してファイルの置き場所としておりました。この頃には社内SEをやっておりましたが、プログラム開発については、あくまでも趣味で小さなものを作ってました。
つねに、同一画像・類似画像の整理をしたい思いはあり続けておりました。2014年初頭で画像ファイル数は170万枚に達しようとしてました。
2014年春ごろ仕事で、ネット上で調べものしている時、遂に見つけてしまったのです。それは軽量で二つの画像の一致度を算出するアルゴリズムです。これがIMCを作成するきっかけを与えくれた、Average HASH法でした。
長くなりますので、ページを分けて行きます。
IMCバージョン1開発
IMCバージョン2開発
IMCバージョン3開発
そして将来に向かって