AIはついに民主化された。
このことにまだ多くの人が気づいていない。
気づいていない理由は二つある。第一に、民主化されたAIを動かすためのハードウェアがまだ少し高価なこと。第二に、民主化されたことを実感するにはまだ多少はプログラミングの知識やスキルがいること。
しかし、その二つを満たした人々、たとえばGOROmanとして知られる近藤義仁氏は気づいている。
このことについて彼と話をしたわけではない。だがたぶん気づいている。なぜか?
GOROmanは512GBのRAMを搭載したMacStudioを持ち歩いているからだ。ストレージを最大限ケチっても150万円はするこのマシン、コンパクトであるが持ち歩くようには設計されていない。しかし彼は持ち歩く。
ドトールで業務
Mac Studioは持ち運びやすいので便利
モニタはXREAL One + Eye pic.twitter.com/CAqexWXbJr— null-sensei (@GOROman) May 19, 2025
彼はなぜ持ち歩くか。
これは世界初の「持ち歩けるスーパーコンピュータ」だからだ。
筆者が共同創業者であるFreeAI社にはAIスーパーコンピュータ「継之助」という社長がいる。その実態はただの「スーパーコンピュータ」だ。
これは重さにして60kg以上ある。とても気軽に持ち歩けない。大きさも、畳半畳ぶんくらい。
それとほとんど同じスペックのマシンが、512GBのRAMを搭載したMacStudioだ。値段も継之助の1/30以下だと考えると、「買わない選択肢はない」と言える。当然、我がFreeAI社も512GBのMacStudioを導入している。
この少し高価に思えるパソコンが、「AIの民主化」を感じ取るための最初のキーアイテムとなる。
あるいは、5090を搭載したPCなどだ。5090はようやく中古が流通してきて、40万円程度で買える。これに上物を加えて60万円くらい。まあ妥当な線だろう。
AIのハードウェアにこれくらいの投資ができる人間は、もうわかっている。AIは民主化された。真の意味で。
画像生成AIで専用のクラウドサービスを使う人はある意味で少数派になってしまった。
筆者自身もおそらく日本で最初の画像生成AIクラウドサービスMemeplexを運営しているが、まだこれをやっている意味は「まだAI用ハードに投資するお金がない人向けにAIの民主化を見せる」という社会的意義のためである。
たとえばカジュアルに画像生成したいなら、ChatGPTの画像生成だけで十分と思える。
画像生成ではMidjourneyやNovelAIがもてはやされた時期もあるが、今は「欲しい画像」はローカルでLoRA(軽量な微調整学習)を作って使うのが普通の使い方だろう。
画像生成が「民主化」されたと感じたのは、言うまでもなくStableDiffusionが登場したときだ。
当初は大容量のVRAM(GPUに搭載された超高速なメモリ)が必要だったものが、オープンソース・コミュニティの力により、ごく小さなVRAMでも生成できるようになり、学習に必要なVRAMすら節約できるようになった。
その後、大規模言語モデルが次々とオープンウェイト化されたが、オープンウェイトのモデルはなかなかトップティアのクラウドサービス(ChatGPTとかClaudeとか)に追いつけずにいた。
昨年は正月から間髪を入れずに動画生成AIの時代の到来をOpenAIのSoraが告げ、告げたもののなかなか一般公開されないので中国勢が次々と動画生成サービスをリリース。昨年末にようやく公開されたSoraは、登場時のインパクトからだいぶ幻滅した状態で投入された。今やSoraよりも中国勢の動画生成AIのほうが高品質(特にアニメなどは)なことはこの世界にいれば常識である。
筆者もSoraや最新のGPTを触るために契約していた月額200ドルのプランを3月で解約し、今何の不自由もない。
もはやChatGPTは最上の選択肢ではなくなっている。この程度なら月額20ドルのプランで十分だと感じている。
かといって、ClaudeやGoogleのGeminiに数百ドル課金する価値があるかといえばこれも微妙だ。いや、確かにある程度の価値はあるが、数十ドルというのが感想である。
なぜか? MacStudioがあれば、かなりのレベルのオープンウェイトのLLMがローカル動作可能だからだ。
MacStudioでは何が違うのかといえば、メモリバンド幅だ。最新のMacStudioの最上位機種のCPUは、M3 Ultraである。最新のM4アーキテクチャでないのは、M3 UltraがM3を2個繋げた構造だからだ。
この構造のおかげで、圧倒的に広いメモリバンド幅を確保し、800GbpsというGPUのVRAM(HBM)に匹敵する能力を獲得している。
Llama4は登場当初はバグがあり期待通りの性能が出ないと誤解されたが、Unslothによって開発された動的量子化と組み合わせることで数百万トークンを一気に処理できるようになった。理論上は1000万トークンまでは扱えるらしいが、それに必要なメモリがどのくらいの規模なのかはわからない。しかし、GoogleのGeminiとOpenAIのChatGPT-4.1はともに100万トークンまでしかサポートしない。つまり、Llama4をローカル運用した方が、性能が上回るのだ。つまりこれが「AIが民主化された」と感じる根拠になっている。
LLMは、それ自体に何かを覚えさせようとすると、どうしてもハルシネーションから逃れられない。ならば、プロンプト自体に知識を詰め込めば良い。それが文脈内学習(ICL;In-Context Learning)だ。学習と名づけられてはいるが、実際には学習するのではなく、プロンプトに入れるだけだ。1000万トークン扱えるLLMとは、プロンプトに990万トークン投じても機能するLLMということになる。どんな企業のマニュアルでも990万字もあるとは考えにくい。990万字のプロンプト(おそらくはマニュアルか六法全書か)の最後に、「で、こんな質問が来てるんだけど答えはなんでしょう?」と質問を書けばいい。これで完璧な内容の答えが得られる。
ローカルのLLMを使う快適さは説明が難しいが、一言で言えば「学生寮に住んでいた子供が、アパートを借りて自分だけの家を手に入れた」ような感覚だ。
たとえばChatGPTにしろClaudeにしろ、日によって機嫌が良かったり悪かったりする。昨日はすらすら答えてくれたのに、今日は的外れなことばかり言ったりする。
クラウドサービスの場合、ユーザーの使用頻度に応じて日々モデルが微妙に変化する。改良しようとしているのか、儲けようとしているのかわからないが、同じプロンプトに対して答えが安定していないのは単に不安になるし、実用的なシステムを構築する上で問題になる。
OpenAIからGPT-3.5 Turboを突然廃止すると宣言されて、それに依拠したシステムを作っていた日本国内の第一生命がピンチに陥ったというニュースは記憶に新しい。
価格もコロコロ変わるし性能も変わるし、答えも毎回変わる。これでは安定したシステムやSLA(サービスレベル保証)を巻くなんてとても無理だ。
こうなる事情もわからないでもない。世界的なGPU不足に加え、GPUそのものが壊れたり、推論のために数が足りなくなったりといったことが頻発する。
さらには、ティアごとにアクセス可能な容量が細かく決められていて、仮にGPTのAPIを使って作ったシステムに大量のユーザーが殺到するとティアによるアクセス制限に引っかかる可能性がある。そんなもの実用的に使えるわけがない。
しかし、ローカルLLMならこうした心配は無用だ。マシンさえ確保すれば、いつでも全力で自分の仕事だけしてくれるし、足りなくなったら増やせばいい。シンプルだ。OpenAIのAPIでアクセス制限にひっかかったとき、いつ修復されるか、どうやったら制限が解除されるかはまるでわからない。そんなもの仕事には使えない。
つまり、トップティアのLLMと互角以上に戦えるローカルLLMが登場し、軽自動車一台ぶんくらいの価格のマシンが登場した今こそ、「AIシステム」の時代が到来する。
これまでのAI企業は「AI」そのものを作ろうとしていた。しかし、その時間はもう終わる。「AIそのもの」を作っていた人たちは競争の波に飲まれてしまう。そもそもオープンウェイトのAIを開発し、配布しているのはスタートアップではない。アリババやテンセント、バイトダンス、Metaといった「ITの巨人」たちだ。彼らが戯れに使う何兆円という投資と、スタートアップでは最初から勝負にならない。
これからはAIを部品として使った「AIシステム」またはそのシステムに人間をも組み込んだ「ヒト-AI共生システム」の時代が本格的にやって来る。
「AIシステム」を一言で言うと、オープンウェイトのAIを組み合わせ、それにユーザーインターフェースや独自のデータを組み合わせたものになる。
たとえば筆者が共同創業者のFreeAI社では、前述したAIスーパーコンピュータ「継之助」に、自社で独自に構築した「経営ノウハウデータベース」と、ユーザーインターフェースを組み合わせ、「経営指導AI」を作ることを目標としている。つまりFreeAIはAIシステム企業と言える。
この一年半の間、毎月さまざまな経営者を集めて、自らの失敗談や教訓、門外不出の生々しい経営資料などを収集していった。特に経営資料は、実際に倒産した会社のキャッシュフローであったり、投資家からお金を集めた際のプレゼン資料だったり、普通に生きていたらまず一生拝めないような貴重な資料の数々だ。それらを我々は「絶対にクラウドにアップロードしない。公開も公表もしない」という条件で、実際の経営経験者、現役の経営者から集め続けた。
普通に考えたら、とても奇妙なことをしていると思えるだろう。実際、一緒にやっている人の中にも「コンピュータは買ったし毎月経営者から話は聞いてるけど、これが本当にAIの"開発"なのか?エンジニアとか雇わなくていいのか?」と何度も聞かれた。
しかし、筆者はこれがこれから先、唯一の正解だと考えている。なぜならば、プログラミングそのものはもはや自分でする必要がないしエンジニアを雇う必要もない。AIがやるから。また、筆者の場合、細かいところは自分でできる。
ソフトウェアそのものに価値はなくなっていく。今までもそうだったが、これからはもっとその傾向が強まる。そもそもソフトウェアはプロプライエタリ(非オープンソース)なものよりも、オープンソースの方が圧倒的に品質が高い。
プロプラの場合、「上司や先輩のコードが明らかに間違っていても、指摘できない」という構造的問題があるが、オープンソースは顔も名前も国籍も知らないひとから送られてきたプルリクエストが機械的に「合理的か、機能するか」という観点から選択され、取り入れられていく。
プルリクエストを送るのは開発者というよりもユーザーだ。
「このプログラムのここが間違っていたから直したよ」というものを送る。使う側が修正しているんだから、仕事としてナインツーファイブでやる気もなく出社してる(あるいはリモートしてる)だけの職業プログラマよりも、熱意のあるユーザーの方がずっと良いコードを書く。
さらに、たいていのソフトウェアはAIが書けるようになってしまった。
それを一番知っているのは、ソフトウェアを書いてる当人たちだろう。
自分では到底書けないような高度なプログラムさえAIが書くことができるようになった今、ソフトウェアを書く仕事というのは早晩縮小される。
ではそうした時代における「AIシステムの価値」とは何か?
差別化要因は、圧倒的にデータの質にある。その次に、ユーザーインターフェースだ。
なぜなら質の低いデータしか持たないAIシステムは、差別化できないからだ。たとえばインターネット上にあるデータしか使えないAIシステムは、早晩コモディティ化する。そうなったときに、差別化するのは難しい。AIとのインターフェースで最も優れたものが音声か文字による会話であることはもう明らかになった。
音声か文字による会話なんて、100年も前からさまざまなインターフェース、ラジオや電話や手紙やワープロや携帯電話やスマートフォンといった形で模索されてきた。
最終的にはスピーカーかイヤホンだけになるだろう。
したがって、ユーザーインターフェースで差別化するのはかなり難しい。
以前、動画視聴体験共有サービスを設計するときに、意図的に情報の非対称性を導入したことがあった。動画視聴体験など、映画やテレビが生まれてからほとんど変化してこなかったからだ。これは結果的に成功したが、これはものすごくトリッキーな方法である。
そんなレベルのユーザーインターフェースの改変が、何度も再現できるとは筆者には思えない。
ということは、やはり「価値」は圧倒的に「独自の、他にないデータの質」を高めることしかない。
これは「ビッグデータ」とは根本的に違うものだということを理解しなくてはならない。
「ビッグデータ」は「たまたま集めてしまった、または集まってしまう巨大なデータ」でしかない。ビッグデータには目的がない。
目的がないデータは「質の高いデータ」とは呼べない。では「質の高いデータ」とは何かというと、大学の授業のようなものだ。目的もなく集められたログとは根本的に違う。
「AIシステム」の面白いところは、根本的なアイデアが技術と無関係なことだ。
たとえば「経営指導AIシステム」を作るために「経営者たちの失敗談や実際の資料を集める」という開発作業は、後半は技術と何の関係もない。
誰でも、アイデアだけで新しい「AIシステム」を作れる。
まるで20世紀末にワールドワイドウェブ(WWW)が颯爽と登場した時のようだ。
あの頃は技術は誰かオタク仲間にやらせて、商売の仕方を考えた人が活躍した。
アイデアと気合いさえあれば元手はほとんどかからない。
大航海時代ならぬ、大AIシステム時代が到来する。
もう、今日にも。
「AIシステム」の可能性を模索するのにうってつけなのがハッカソンだ。
今日は「全日本AIハッカソン」の九州大会で筆者は福岡にいる。現在、次の北海道大会の出場者を募集しているところだ。
AIハッカソンでは、AIそのものを作るのではなく、AIを使ってシステムまたはアプリを作る。
既に開催された東京大会、大阪大会ではそれぞれユニークな作品が生まれた。
AIシステムの面白いところは、前述のように、「アイデアさえあれば全く新しい独自のものを生み出せる」ところにある。
一人でも参加できるビギナー部門(プログラム経験不要)と、3人1チームで参加する一般部門がある。一応、その地域に住んでいなくても参加することは可能だ。
東京大会と大阪大会は参加者が殺到して抽選に漏れてしまった人が多いが、地方大会は意外と穴場である。
この機会にぜひ挑戦してみては?
新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。