ChatGPT等生成系AIの現 ...-ICT技術調査 デジタルヘルス情報提供-株式会社テックナレッジハウス

BLOG / デジタルヘルスの未来

ChatGPT等生成系AIの現在地と社会的課題 その1 現在地

2023.09.05 その他

4月5月の当ブログでは生成系AIとヘルスケアに関わりについてふれた。GPTとChatGPTは、これまでにない人間らしい対応の機能や新たなもの(テキストや画像など)を創造する機能を持っているように見える。皆さんも、日常、試しておられることと思うが、今回と次回で生成系AIの持つ特徴や現状を簡単に整理した上で課題を整理してみたい。

生成系AIには、これまでのAIのない素晴らしい機能を持つ一方、大元のモデルの性格上の欠陥があり、それなりに技術的に解決策があるものから、社会でルール決めをしない限りは社会的問題を引き起こすことまでさまざまであり、社会に影響を及ぼす部分については、各国や企業・団体は勿論のこと、世界レベルで解決する枠組みも必要と言われている。

今回はまず生成系AIの現状を俯瞰する。

1.生成系AIの意義
– 2022年11月にOpen AIがChatGPTを発表して以降、学会や実業界だけでなく、一般人の間にも生成系AIの大センセーションを引き起こした。
– 生成系AIは、テキスト、画像などを生成することができ、AIモデルと大量データの学習の組合せで、これまでのような現状データからの分析や予想を越えて、全く新しい創造的なことができるようになった。
– 生成系AIの学問的な意義として、新しいAIで汎用的AI(人並みの推論能力を持つAI)の一歩手前まで技術が進んできた、との考えがある一方、相変わらず中味を理解して考えられないので根本的には変わっていないとの指摘(Gary Marcus元ニューヨーク大学教授他)もある。  

2.生成系AIのベースであるLLMの特徴
– 生成系AIは、大量のデータで学習したLLM(大規模言語モデル)が代表する基盤モデル
 (Foundation Model)をベースとしてできている。以前のAIモデルと比較して学習データを大量にしてモデルを大規模化すること(モデルのパラメータ数がふえる)で、文書などを作成したり、要約したりするようなことができるようになった。
– アウトプットのできは、学習データの内容により大きく左右される。
現在の文書系のLLMの大量の学習データは、 Wikipediaや自動的にwebから集めたデータが大部分を占める。このため、
 1)正しくない情報も混ざる。 
 2)知識の全面的入れ替えになる更新をめったに行わないので、一般公開されているChatGPT(GPT3.5ベース)では2021年9月の情報までしか入っていない。
これは有料版のChatGPT plus(GPT-4ベース)でも変わらないと理解している。
– 基盤モデルは、OpenAIとMicrosoftの連合(MicrosoftはOpenAIの株式を49%所有)とGoogleが先行するが、スタートアップ系やオープンソースも存在する。2023/5時点で生成系AIのユニコーン(時価総額の評価が10億ドル以上)が13社存在する。

3.生成系AIのソリューション
– MicrosoftとOpenAIの連合とGoogleは、自社のオフィス系ソリューションに対して
 自社の基盤モデルの適用を行うとともに、パブリッククラウド(AWS, MicrosoftのAzure、Google Cloudが3強)は、今年になって相次いでクラウド上での生成系AIのサービスを開始した。
– AzureとGoogle Cloudが、企業が生成系AIのアプリを開発するためのツールの提供・機能強化を牽引している。これにより、SIの会社だけでなくユーザ企業の平均的ITエンジニアでも生成系AIのアプリ作成に参加できるようなAIの民主化が進みつつある。 
– 活用分野は以下のように幅広い。
  1)社内情報の検索や問合せから外部向けのコールセンターやチャットボット
  2)マーケティングのコンテンツ作成、建築の意匠設計、イラスト作成など
  3)パーソナライズされたマーケティング、SCM最適化など応用分野
  4)ソフトウェアのコーディング
  5)セキュリティや創薬など高度な専門分野
– 一方、自社で基盤モデルを扱えるSWベンダーは、既に生成系AIのアプリの提供を始めた。海外のベンダーだが、マーケティングのコンテンツ作成では、JasperやWRITERがある。
– 生成系AI関連SWのマップはいろいろあるが、ここでは、Forbesが2023/4/11に発表したAI 50 2023を引用する。Forbesは応募のあった800社から選定した。選定にあたり、VC(ベンチャーキャピタル)のSEQUOIAとMERITECHが情報を提供した。AIベンダーマッピングというが生成系AI関係の会社が多い点が興味深い。
– このリストには”Healthcare”と分類されているところに下記の5社が入っている。
(なお、各社のハイパーリンクは、会社の事業内容がわかりやすく説明されているサイトを選んであり、英語のサイトの場合もあります。)
 1)VIZ.AI CT画像解析で大血管閉塞の初期症状を発見し医師に知らせるシステム。
 2)Bayesian Health 患者の電子カルテデータから敗血症を早期発見する。
 3)insitro   機械学習を使った創薬。細胞の分析などの基礎研究から始める。
 4)PathAI       病理へのAIの利用で創薬や診断に貢献する。
 5)UNLEARN   AIを利用した医薬の臨床試験の効率化。

(出典)https://www.sequoiacap.com/article/ai-50-2023/ 

4.今後の方向性
 生成系AIのアプリを作成できるツールが登場して日々進化しており、ベースとなる大規模モデルの誤ったデータを含んだり新しい情報を持ち合わせないなどの欠陥をかなりの程度補う機能も提供されつつあるが、計算資源を多く利用しエコに反するという問題も抱える。
このため、オープンソースなどのモデルをベースとして、専門分野に特化した小規模のモデルを提供する動きが欧米ベンダー中心にでており、日本では、たとえばシステムインテグレータのNECが2023/7に発表している。小規模モデルの今後の発展にも大いに期待したい。