号漫浪正大

輪るピングドラム ~物語を見直す

ニュースなどを見て思った事。23年6月19日

またyoutubeを見て思った事を書きます。

そしてまた、AI関連です。

 

堀江貴文さんと深津貴之さんが、ホリエモンチャンネルで話してました。

実はこれは少し前に見てたのですが、面白いのでまた少し見直しました。

すると、前に言い忘れていた事が色々思い出して来たので、少し書きます。

 

私は素人です。注意です。あくまで叩き台として聞いて下さい。

 

深津さんが「ChatGPTは(日本語で)4000文字位しか記憶できない」みたいな事を言っていました。

ああーなるほどね、っと思いました。

分かると思いますが、コンピューターが4000文字しか記憶できない訳が無い。

たぶんですが、つまり4000文字分全てで、毎回、回答を考えているのでしょう。

 

人は前聞いた物を強く覚えています。その一個前はもう少し弱く思っている。

そして、もっとさかのぼるほど、弱くしか覚えて無い。

しかし肝心な事は分かっていて、大事な所は別の記憶としてメモって置くのです。

話ながら、大事な所を、本当に紙に書いて忘れないようにするかのごとくです。

 

ChatGPTはそれが無く(もしくは弱く)4000字分全てを覚えていて、毎回一つの文としてとらえ、そこから答えを探してるのじゃ無いのかな?

 

例えばサッカーの話をしている。人は、それを忘れないように頭の別の所にメモしておくのです。

それがあるから「ロナウドがね」と話し始めたらサッカー選手の「ロナウドだろう」と分かり、そこら更に常識から「今現在の話なら、クリスティアーノの方だろう?」と予測が出来るのです。

これがサッカーの話だと分からなければ「どこのロナウドだろう?」と思うと言う事です。

 

人はこの大事な所は別に覚えておくが、ChatGPTにはそれがないとします。

ChatGPTにも「サッカーの話だ」と言っておけば「サッカー選手の名前だろう」と思う。

しかし話が弾み、「サッカーの話だ」と言ったのが4000字より前になったとしたら?

きっと、急に「ロナウドとは誰の事ですか?」と聞いてくる筈なのです。

 

もう一度言いますが、これは私の仮定です。

しかしそう考えると、4000字などの短い記憶しかない事に納得します。

 

だからこれ以上は人をシミュレートする必要が出て来るし、違うやり方が必要になる、とは前に言った通りです。

人と同じように、大事な言葉は別に(点数や順位を付けて)覚えておく必要があるでしょう。

もちろん、ある一定以上話が過ぎれば、しかもその記憶が使わなければ、それはもう大事ではないと消しても良いでしょう。

サッカーの話だったのに、野球の話になり、ゲームの話になったのなら、サッカーの話だったのは、忘れても普通だと言う事です。

 

 

他の事。

ここでも堀江さんが言ってたのが、多くの人が「文脈が分からない」と言う意味で「文字が読めない」と言ってました。

「ここでも」と言ったのは、堀江さんは良くこれを言ってるからです。

たぶん、思ったよりは、文字の文が理解出てない人が多いのは、認めます。

しかし(たぶんですが)読めない人より「読まない人」が多いのです。

 

実は最近私自身がそうなってきたので分かったのですが「文字を飛ばし読みする」癖が付いてきました。

つまり、単語単語だけを飛ばして読んで、なんとなく内容が分かる程度しか理解してないと言う事です。

 

たぶん頑張れば、文を理解できる人はもっと多いのだろうけど、みんな読む気が無いのだと思います。面倒くさいのです。

 

自分もそうなのだが、これは悪い癖です(私は昔は無かったので、最近の癖です)。

ではなぜそうなったのか?

もちろん、文字を読まなくなった弊害でしょう。本を読まなくなったので、そこは大きいのは確かでしょう。

 

しかしそれだけでも無い。

世にある文には、無駄が多いのです。駄文が多すぎる。

見ても無駄だった時間の方が多いのに、頑張って見ると疲れるのです。

 

実はこの事は堀江さん自体もヒントを言っています。だから面白い訳ですけど。

堀江さんは本を書く時、出版社の人に「本は三つ良い事が書いてあればいい。後はどう埋めていくか」みたいな事を言われたのだそうです。

つまり、大体の本はそうなっていると言う事です。

ほぼ無駄な事で水増ししていると言う事です。

 

これはyahooニュースなどで出て来るどこかのコラムの様な文もそうです。

とにかく無駄が多く、何を言いたのかすら分からないか、くだらない事を言ってる事が多すぎる。

文字を書くプロでもアマチュアでも、みなコラムでも本でも、ある程度の長さで金をもらっている。内容ではなく、文字数で金をもらっているような物です(実際本当に文字数でもらってるのがいるようですが)。

だから、刺激的で、客が興味を湧き、しかし内容なんて元々ない物を、更に水増ししている文ばかりです。

これで「文脈を分かるようにちゃんと読め」と言う方がおかしい。

まずは、世間にあふれている「意味のない水増しされたくだらない文」を無くす事から始めるべきでしょう。

じゃないと、ますます文字なんてすたれて行きます。

 

これはyoutubeでも同じです。

意味のない水増しされた内容が多いですね。

これも長さで金を稼いでいるからです。

 

内容自体を褒める世間にしないといけません。

それに、水増しされた下らない物を羅列する人は、皆で叩くべきです。

校長先生の話だとか、先生と言われる人の話だとか、会長のありがたい話だとかもそうです。

 

 

AIから話がずれましたが、物の本質を理解して、何が大事で何が大事でないかを分かってないと、今後のAI開発は難しいと思います。

AIとは人を理解しないと難しいのと、物事の本質を理解しなと難しいと思います。

それが分からない人が、何が作れ、何が出来ると言うのだろう? と言うのが私の意見です。

 

 

ただ、AIや機械学習が面白いのは「何も分からなくても、沢山の事例から結果を出してしまう事がある」と言う事です。

ChatGPTなどはまさにどうでしょう。

開発者でも「どの程度の事が出来るのか?」は、出来るまで分からなかったようですし。

だから私が「AI開発には、人を理解する必要がある」と言うのは、間違っているかも知れない事は、言っておきます。

「人を理解出来なくても、意外と出来る事もあるだろう」って事です。

 

ただ(多分ですが)それでも、人を理解してないと、今後は難しいと思います。

それは、どの程度のサンプルがあり、そこからどの程度の結果を出せるのか? は結局は、はっきりは分からないだろう、と思うからです。

 

例えば、今現在、画像生成AIで「人がこける(ころぶ)画像」を作るのは無理みたいです。

言ってみれば、こける絵なんて描く人はいないし、こける写真も一瞬なので撮れないですね。

でも人は他人がこける所もたまに見るし、自分も転ぶ事もある。だからなんとなく知っている。

しかし画像も無いからサンプルがなく、だから画像生成AIでは書けないのです。

 

つまり、サンプルから作られる物は、どの程度まで出来るかは分かってないと言う事です。

なので、膨大なサンプルが集まれば出来るだろうけど、人の行動や考えを全てのサンプルを集める事は無理じゃ無いのかな? と思っています。

だから、人のシミュレートが必要になる気がするのです。

(明らかに今のAIは、ネットで多量のサンプルが見付かるのが前提で出来てます。ネットが流行ったおかげで出来た代物です)

 

 

さて、youtubeの堀江さんの話に戻します。

ここで面白い事を言ってたのが「カメラが発達するから、ラーメンの味も分かるようになるのじゃ無いのか?」と言ってた所です(微細なラーメンの成分まで見える様になる事で、味まで予測が出来ると言う事)。

これは私には、目からうろこでしたね。

カメラなどは人の目よりずっと良いのだから、人では出来ない事が、ロボットはカメラで出来るようになるかもしれない、と言うのは面白い話でした。

 

私は、AIが今後大事なるのは「何でも出来る」からだと思っています。

専用機でいいのなら、たぶん色々、今でも出来る。

しかしAIがすごいのは汎用機が出来る事です。これが大事になります。

 

例えば、餃子を作る機械はあるでしょう。大手の会社だと手で作ってられないから、ロボットで作るのがマストでしょう。

しかし人は、まず餃子は自分で手で作ります。

なぜか? それは専用機は、値段が高いからです。それにでかく、邪魔ですし。

 

「値段の問題なのか?」と言う人もいると思いますが、多くの問題は、値段と効率の問題です。

 

しかしAIロボなら、何でも出来るから、餃子も作ってくれるかもしれない。

何でも出来るAIロボットなら高くても買う人もいるし、それに餃子も作らせるかもしれない、と言う事です。

 

ただそれには手が必要です。

私はAIに必要なのは「手」だとずっと思っています。

 

そして手には何が必要か?

もちろん精度とか丈夫さ等も必要でしょう。

しかし私は「感度」じゃ無いのかな? と思っています。つまり感触です。

人は、何かを取る時も、何かを並べる時も、あまり見なくても出来ます。

本を棚に並べるとか、取る時などです。

それは感触があるから、それで判断してる分が大きいでしょう。

チャーハンを作る為、鍋を振るにも感触で出来る筈です。餃子を包むのも、半分目をつぶっていても出来る事でしょう。

つまり、感触が必要だろう、とずっと思ってました。

 

さて、やっと話が戻りますが、もしかしたらカメラで感触を(ある程度)補う事も出来るかもな? と考えが変わってきました。

高感度カメラで、しかもとても早い判断が出来るロボットのカメラなら、目だけで、物を掴む強さを判断出来るようになるかもしれない、と思えて来たのです。

 

ただ、そうは言っても、見えない所は分からないし(手の陰になって見えないとか)万能ではないだろうとは、思います。

だから、本当にカメラで感触の代わりが出来るかは分かりませんが「人とは違う方法で出来るのがロボットだ」と言うのを堀江さんの話で再認識出来たのは良かったです。

 

 

さて堀江さんお話で、他の事で気になった事。

 

フォートナイトのメタバース化が進んでいるようです。

そりゃそうです。そうするべきであり、それが分かってない他の人達が馬鹿なだけです。

 

フォートナイト内でゲームが作れるとか、別のプログラムさえも取り入れられるようになるようです。

そりゃそうです。そうしろって言ってるじゃないか(ここで言ってもしょうがないけど、私は素人なので力がないのです)。

 

でもまだゲームだけですね。

分かって無いのか? 分かっているけど段階を踏んで、隠しているのか? はわかりません。

ゲーム以外のメタバース化が出来て、初めて勝負でしょう。

ただ、フォートナイトは中国資本が入っているのと、ゲーム色が強すぎるので、メタバース化は難しいかもしれません。

 

では、追随して、追い越せる所はどこか? ってなると、やはりマイクロソフトなんだよね。やはりあそこは怖いね。

 

メタバース提供会社が結局勝つ」と私はずっと言ってるけど、それが出来るのがマイクロソフトだと言う事です。

マイクロソフトなら、大手銀行とか家電量販店とか旅行会社とかでも、やってくれる気がします。もちろん手数料はかかります。

サーバもセキュリティーもお金の払いも、すべて提供してしまうのがいいでしょう。

もちろん、簡単にすぐに3Dで、家やアイテムを作れるように出来ていなくてはいけません。

 

今後AIなんかで、フェイク画像も簡単に作れる事でしょう。

だとしたら、どこかが「このサイトは安全、宣言」をする事が大事になるかもしれません。

マイクロソフトメタバースを提供するのなら、マイクロソフトが「この場所は間違いなく〇〇銀行です」と言うお墨付きを付ける事が出来る。

もちろん、お金をとるからこそ、その「本物認証」を提供する事も、仕事として成り立つと言う事です。

 

メタバース内で「○○テレビ」や「○○ニュース」や「○○出版」があっても良く、そこの情報にはお墨付きを付けれる、と言う事でもあります。

 

他にも、例えば中小の販売会社でも、お墨付きがもらえるかもしれない。

100万円、一時預け金をマイクロソフトに渡す事により「全体で100万までは支払いに使っても、最終的にマイクロソフトが保障します」と言うようにする事も出来る。

もちろん「あなたの会社の実績なら、100万で1000万まで保証する」みたいな、保証会社も兼ねてもいいだろう。

 

まあ、なんであれ、メタバースは世界を牛耳れる可能性があるので、私がGAFAM(今ならMATANAか?)なら、準備位はしておくけどね。

 

メタバースに大事なのはVRでもなく、3DCGですらない。

初代ドラクエみたいな絵しか出せない携帯なら、初代ドラクエ画像だっていいじゃないか?

大事なのは「世界を構築」する事です。

そして「安全」「安心」で「役に立ち」、しかも「皆がいる世界」である事です。

 

 

さてまた堀江さんの話に戻ります。

堀江さんは「今後大事なのは音声だ」と思ってるようです。たぶんそうでしょう。

人の秘書がいたとする。「今日の天気は?」とか「今日のスケジュールは?」と言葉で聞くでしょ?

そして答えも言葉で帰ってます。

秘書に、紙に書いた「今日の天気は?」と言う文字を見せる馬鹿はいない。

なので、音声が大事になるのは間違いはないでしょう。

 

もちろん音声には限界はありますが、それも現実世界から考えれば、大体は何が出来るかは分かる事でしょう。

地図は絵で見ないと分かりずらいですよね?

 

 

さあ、面白い未来になりそうです。

ただ私には遅すぎましたかね?

たぶんですが、世界がまるっきり変わった頃には、もう世界などどうでもいいお年頃になっていそうです。

養老さんが虫取りをしてる様に、私もその頃はAIではなく、木々を見て散歩をしている気がしてならないのです。

はたして、何が正解なのでしょうね?