情報通信技術革命とビッグデータ
情報通信技術は、その能力の指数関数的な向上と価格低下に伴い、世界全体に急速に浸透し、ほぼすべての産業や社会全体、企業のビジネスモデル、個人のライフスタイルなど様々な領域で大きな変化をもたらしています。ガラ携からスマートフォンへのシフト、コモディティ化、新興国市場の拡大など、従来の市場競争のあり方を根本から変革し、産業や社会構造そのものにも大きな影響を及ぼしています。また、「ムーアの法則」に代表されるコンピュータ処理能力の指数的向上、M2Mの普及等は、今まで利用することが困難だった多量多種のデータの収集、蓄積等をリアルタイムで行えるようになりました。またこれらのデータを分析することで、未来の予測や異変の察知を行い、消費者個々のニーズに即したサービスの提供、業務運営効率化や新産業創出等が可能となっています。
すでに一般的となっているITの概念に、通信コミュニケーションの重要性を加味したICT(Information and Communication Technology=インフォメーション・アンド・コミュニケーション・テクノロジー)は、ビッグデータとともに、経済再生のキーワードとなっています。大量の画像・動画を共有するWebサイトが普及し、誰もが自分の撮影した画像・映像を公開し、他人の撮影した画像・映像を閲覧することが可能になっています。このように我々の周りにはデジタル画像・映像データが溢れている一方で、大量の画像・映像データに対して検索を行うには、人手によって付けられたタグと呼ばれるテキスト情報や、自動で付けられた撮影日時の情報を用いていました。しかし、現在は各種アプリにより、画像・映像と文章がまとまって記録・通信されるようになっていて、非常に大量の画像・映像データが集積されたビッグ・データの時代になっています。これらのビッグデータから、シーンや対象物の意味内容を計算機が理解し、それに基づいて意味内容による検索を行なうことも現実になっています。ここで、「理解」「意味内容」と書きましたが、現実のAIは非常に多量のデータから、幾層にも深く配列されたニューラルネットワークにより、似たものを探し出しそれらの類似点や差異を自動的にピックアップし、より誤差の少ない判別法を自動的に探し出す手法が採用されており、何故ほぼ正確に判別できるのか、あるいは将棋ソフトなどで何故その手を選ぶのかについての理由が開発者にも理解できず、また、AI自身でも説明できない状態になっていることが非常に不安な要素となっています。
一般の画像・映像が表すシーンや含まれている物体、動作、イベントなどの多様性が極めて高く、外的な要因に支えられている人間の顔認識などの一部の対象を除いて、実用的な認識精度を達成することが困難と言われていました。しかし、一般的な画像・映像に対する認識の研究は、近年の流通情報の爆発的増大により急速に進歩しており、認識技術を用いた意味的な検索の実用化まであと僅かの段階まで近づいています。現在「特異点=シンギュラリティー」と言う名称で、AIが完全に人間を追い越して勝手に判断を始める日が来ることが心配されています。
現時点での重大な関心事は、爆発的に増加した通信量と情報量です。個人が、処理しきれないほどの情報にさらされると、頭はパニックに陥り、判断力が鈍りがちとなります。現在では、知識だけではなく、元データから解析ツールまで、自由にかつ必要に応じて入手でき、アクセス可能な情報の幅と量は桁違いに大きくなりましたが、情報を検索・取捨選択する手間や時間も無視できなくなるほど大きくなってしまいました。結果的に、深く考える時間は減る一方となっています。クラウド技術の進展により、個人の膨大なデータや公共図書館所蔵書籍のコンテンツが特定の企業の集中貯蔵センターに蓄積されており、便利さの裏でプライバシーの喪失が現実となっています。
本章では、データ圧縮技術や情報検索技術に係る事項を取り扱います。下記の報告書を参考にしています。
平成17 年度情報流通センサス報告書
我が国の情報通信市場の実態と情報流通量の計量に関する調査研究結果(平成21年度) ―情報流通インデックスの計量―
次ページ 2014.10.10作成 2017.6.27改定