社内SEゆうきの徒然日記

社内SE歴20年以上の経験からIT全般についてつぶやきます

誤情報を減らすプロンプトの書き方(ハルシネーション対策)

 

AI奥深いなと思って、AIでいろいろ遊ぶ?日々

 

触ったり調べたりしていろいろ分かったことたくさん

 

細かいことはたくさんあるけど、大きなことは以下の通り

 

誤情報(ハルシネーション)が一定数発生するのは、生成AIツールによるものでなく、AIの特性 

 

当初、chatGPTがAIの代名詞といわんばかりに一人勝ちしていたので、chatGPTはわざと誤情報を出すのかな、わざと誤情報出すように仕組んでいるのかな、AI使えん! と思っていたこともあった。

その後、各社いろいろなAIツールが出てきて比較したら、各社とも大なり小なり誤情報がある。で、誤情報の頻度はこの1年で大幅に改善。(でも完全にはないわけじゃないけど)

で、、、調べたら…

business.ntt-east.co.jp

誤情報=ハルシネーション

AIはそんな特性があったみたい。

 

AI開発者ではないから、ハルシネーション発生の技術的メカニズムは

よくわからないけど。。。。

昔ながらのIT知識では、あらかじめ誤情報が出るような仕組みを潜ませない限り、そのようなことは理論的に起きない。

AIだとそうとも言い切れないみたい

 

ちょっと未来過ぎてついていけない 汗

 

AIのインフラ部分ならまだしも、AIの最新についていけないのに、昔の知識でAIの最前線をあーだこーだ口出すのは「老害」といわれても仕方ないかもね。

若い人たちに煙たがられるのは嫌だもんね。

頭に入れておかなきゃ。

 

政治家もね!

 

 

 

では誤情報には無力なのかというとそうではなくて、プロンプトの書き方を工夫すると大幅に誤情報低減できるみたい。

note.com

ここに書かれていること試してみたけど、だいたい本当

具体的な情報を要求したり、「~という情報は入れないで」とプロンプトに書くと誤情報が減って、返答の質も高くなりがち。

 

ここに書かれていない&プロンプトの書き方と関係しない点については

・学習元のインターネットに転がっている情報の少ない分野の受け答えは苦手

という傾向を確認済み。

例えばこんな感じ

 

得意 コンピュータ関連情報、ガジェット関連情報

苦手 日本語での海外関連情報、地方ネタ

普通 全国に関係あるもの・・・

   「日本のJR路線網全体の経営方針は…」みたいな

 

画像生成AIでもインターネット上の写真の少ない地域の風景写真を書かせるのは苦手だな、と思ったり。

アメリカは得意でも、日本の地方は情報量が絶対に少ないので、なんか違うなーと思う写真がたくさん出てくる

 

ただ、それでも少なからず誤情報=ハルシネーションは発生するので、AIには大なり小なりハルシネーションは発生するものという前提に立ち、

すべてのAI生成物はユーザー自身の目によるファクトチェックが必要という前提にたつ必要あり。AIは誤情報=ハルシネーションを排除することは、AIの技術特性的に不可能。 AI側で誤情報を減らすにしても限界があるので、そういうものだと利用者側に啓蒙活動すべき。利用者もAIの言うことは100%正しいのではなく、ファクトチェックが必要。そういうものだと認識してファクトチェックは習慣にするすべき。そう考えると今後普及するAIはファクトチェックのやりやすいUIを備えたAIになりそう。参照元URLを明記してあったり、もっというと、Genspark Agent AIみたいに参照元のURLだけでなく、参照した箇所もハイライトしてわかるようにしたり。

 

*啓蒙活動

 

利用者に啓蒙活動をするといっても、しょせんここは弱小ブログ。

たいして読んでいる人もいないので、ここで何か言ったところで何も変わらないと思います。偉い人も読んでいるわけありませんし。

AIの発展を願う人は、この記事の内容の拡散または説明が大変ならば、この記事へのURLをSNS,ブログ等で拡散してください。

 

https://www.youtube.com/watch?v=JxsBWrpX7BQ

gensperk AIも少し触った感じ優秀そう、ファクトチェック機能は素晴らしいUI。ファクトチェックの充実度はたぶんダントツ一位。ハルシネーションも少なめ。変わりに調査に15分ほど。geminiの2,3倍時間がかかる。

だけど、セキュリティ面はちょっと気になった口コミがあったので、ファクトチェック中。。。情報少ないから今は何とも言えない…

(ネット情報は、オールドメディアと同じく、憶測に基づく誤情報も多いから口コミうのみは危険。ファクトチェックは必須)

 

ハルシネーション=誤情報の話を知って思ったのは、

www.daily.co.jp

 

ニュースをあちこち見ていると、規制に一番積極的なのは村上総務大臣のようです。

 


「悪質な誤情報」を出した事業者公表へ

 

ということは、AIは少なからず誤情報が出る可能性があると考えると、日本でAI関係に手を出すと違法と認定され、名前を公表される可能性が高い。

AIの特性考えると日本でAIやるな、ということと同義語。

 

ハルシネーション以外にも基本的にAIは、deep learning技術を使っているので、みんなが誤情報を言っていたら、AIもそういってしまうこともあり。

例えばほとんどの人が「カラスは白い」と言っていると、AIも「カラスは白い」と誤情報を言いがち。この場合、誤情報を流しているのは、AIというより、不特定多数。

このような場合もAI事業者は社名公表の社会的制裁を受ける?

ちなみに、Google geminiは政治(政治家)に関することは一切答えないようになってる。何言われるかわからないから、無難かもね

 

 

・そもそも悪質な定義は? 

・意図的な世論誘導目的の返答かどうかはどのように判断するのか具体的な手法は?

・誰がそれを判断?官僚?裁判官? 裁判官の判断は100%正しいといえる?

 この前、裁判官の下した袴田さん死刑という判断は冤罪ということで無罪にひっくり返ったよね?人間の判断って100%正しいとは言い切れない、そんなもんだよね。

 

 

20年ちょっと前までは、「北朝鮮は日本人の拉致している」というのは誤情報で、それを言う人たちは陰謀論者とレッテルを張り周囲みんなで、邪険に扱ってたよね?

 

政権と時によって本当のことが変わる。

神様じゃあるまいし、何が本当で、何が偽情報と判断するのは乱暴。

toratora-media.jp

で、、、、誰が(どういう手法)で偽情報と判断?

動かぬ物的証拠があればわかるけど

日本ファクトチェックセンターが偽情報と判断?

 

 

 →同じ理由で日本ファクトチェックセンターも信用していない。7割がたは正しいかな、と思うけど、3割程度はマスコミ等の世論誘導が混じっていて(委員はオールドメディア出身者)誤情報流しているな、という印象

日本ファクトチェックセンター - Wikipedia

日本ファクトチェックセンターも全く信用できないから、ユーザーが自分の目でファクトチェックさせる仕組みがいいかと。

 

 

・オールドメディアは意図的な世論誘導しているけど、それは野放し?

 

上の4点、誰しも聞いて納得する明確な回答政府にしてほしいですね。

 

 

生成AIのコードに誤情報をわざと出すように業者が仕組めば、そりゃ悪質だね!となるけど、政府にそんなコード読めるような高度なスキルできる人はいないでしょう。

そもそもコードは企業秘密だから、Grokみたいなオープンソース以外は業者はコード公開するはずないし。

(Grokはオープンソースだから、もし悪質な事業者扱いすると、仕込んでいるかソースコード読め!読めない?と多くの人に突っ込まれて炎上するのは必至

オープンソース以外は意図的な悪質な仕組みを組み込んでいるか技術的に検証は不可能。個人の感想で判断するのみ)

 

「規制」ってAI≒ITの仕組みを知らない人の発想と思ったり…。

 

となると、消去法的に、各省庁、大臣、与党の国会議員が誤情報かどうか判断。

つまり個人の感想で判断

要は十分に恣意的判断が入るということ。

罰則なしといっても、会社名公表されて風評被害がたてば今後の経営へのダメージ大きいから、それこそ罰金100万円の方がまだダメージが少ないと思うけど。

 

風評被害=社会的制裁は非常に大きい。

現政権に都合の悪いことを言えば、悪質な誤情報と認定されかねない

例えば個人的見解は置いておき、今話題の例でいえば

 

103万円の壁、引き上げたほうがいいというと現政権下では誤情報扱い 財政負担があるから引き上げない方がいいというと正しい情報になるということ。

 

政治的な案件なので、どちらがいいかという個人的意見は控えるとして、意見の分かれる話題でも、悪質な誤情報扱いということにすれば反対意見はつぶして、賛成意見だけにするという運用ができちゃう。

 

反対意見は認めないってどこの地上の楽園と思っちゃうなー。

これはAI事業者、日本はこんなに新しいことをやりづらい国と思って、どんどん海外に逃亡して、日本のIT敗戦国が加速する一方

どうして、こういう先読みができないんだろう。。。

 

 

 

AIの進歩は日進月歩。数か月前の印象が、今では全然変わることも。

数か月前まではchatGPTの独壇場。

それは間違いなし。

でもこの数か月熾烈な開発競争が進んで、Google gemini AIもほぼ肩を並べてきて、

アメリカのメディア報道を見ると(ダークホース?)Grokが急に性能を上げてきて、

評判もいいみたい 

また、全てのAIツールで誤情報=ハルシネーションが低減。

 

AIのツールは日進月歩で進歩しているから、1年くらい前の記憶にとらわれずに、AIは誤情報ばかりでつかえない(ちょっとは出ることあるけど)と決めつけず、今現在の全体を見たほうがいいみたい

・・・それにしても有力なライバル名で日本企業が一つも出ないのは、規制多めで日本は新しいことがやりづらいから、どんどん日本企業弱体化しているんだなーと実感。。。

 

Grokも評判いいっぽい by アメリカニュース

 

今までノーマークだったけどXのAI Grokも急激に進化して評判いい。

 

基本的に日本マスコミは、イーロンマスク嫌いがすごいから、あまり取り上げられない…好きか嫌いかは置いておき、中身なのにね。

坊主憎けりゃ袈裟まで憎いというのはちょっと大人げないような…

 

 

lifehacker.com

日本はgrokアプリ出たの?

 

www.pymnts.com

 

www.tomsguide.com

個人の感想ながら、ChatGPTとGrok を対戦させて、Grokの方が上って…

あとで、試してみよっ

indianexpress.com

Twitter が 2006 年から活動していることを考えると、Grok AI はPOST/ツイートのリアルタイムなデータを主な学習元に使用しているので情報の宝庫と言えます。数十億のツイートとは別に、学者、専門家、著名人、ニュースからの膨大な情報が蓄積されています。これにより、Grok AI は他の製品とは一線を画します。

Fact-check in real time

Grok can be a great way to fact-check tweets. It can be a great tool to summarise news along with referencing texts, giving it an edge over ChatGPT and Gemini. This is possible as Grok has access to X’s data, which also gives it accuracy and traceability. One can simply paste the URL to a Tweet and ask the chatbot to do a fact check. It will show a detailed response about the tweet. 

 Fact-checking with Grok in real time.

Travel planner

Grok AI can be used as a travel planner. One can simply ask the chatbot to create a travel itinerary for them, and the chatbot will create a detailed itinerary. Besides, one will also get the links to the source of the information. 

 

Grokはリリース直後触って、日本語対応不十分だな、、、と思ってノーマークだったけど、Grokも今後追っておかないとね。

 

とりあえずいえること

 

最初は、ChatGPTが圧勝だったから、ほとんどの人はchatGPT以外マークしてない人が多そうだけど、最近はライバルの追い上げすごくgeminiもgrokなどchatGPT以外 もマークしたほうがよさそう…

触れたことないけど、Copilot for microsoft365 も、まだ発展途上ながら、先々期待できそう。Excelで計算は誤情報出るのが怖くて、みんなが触るようになるのははもうちょっと先かな、という気もするけど、プロンプト入れるだけでパワポ自動作成はできたら面白そう。目ですぐにファクトチェックできるし。

 

www.youtube.com

 

AI業界は競争すごいね&競争相手に日本企業が一つもないのは寂しいね。

 

 

関連記事

k5963k.hateblo.jp

削除されたファイルをごみ箱に移動させないで削除する-ローカルグループポリシー(gpedit.msc)欲しいな

www.billionwallet.com

 

こういう機能あったらいいな、と思って調べたらあったと思ったら、違った。

 

「ゴミ箱を空にしたらセクタ単位でファイルを完全削除するActiveDirectoryのGroupPolicy作ってくれないかなー >マイクロソフトさん

 

今は完全ファイル削除するツールを入れて、ごみ箱を空にするのではなく、そっち使うように言っているけど、半分くらいしか言うこと聞いてくれないんだなー まあ、注意してもそんなもの。

みんな言うこと聞かないよ

 

システム的に強制しないと。。。ADのグループポリシー追加されないかな もちろんWin11対応 システムって言わないと改善されないよ。

逆に少数でも言えばあっさり変わる。情シスってみんなが思っている以上に発言力あるよ

 

以前はWindows Updateランダムな時期に配布されてたけど情シスの人がそれじゃあ予定が組めない!とごく少数の人が改善要求出したら、毎月第一週ににwindows updateがかかるように世界中のwindowsでかわった・・・

(この機能に限らずいっても無駄と勘違いしていてあきらめて言わない人が多い)

これがwindows updateが毎月第一水曜日になった経緯。

みんなが思っている以上にマイクロソフトは個人ユーザーの言うことにはまだしも企業の情シスの言うことを、気にしてる

 

PマークとISMSどっちがいい?(違い)

 

最近、話題の情報管理認証 Pマーク ISMS違いがよくわからない人も多いと思うけど、違いはこんな感じ。

 

ninsho-partner.com

 

・Pマーク 個人情報 日本国内のみ通用

・ISMS 個人情報+機密情報 国際認証

 

簡単に言うとこんな感じ。厳しさはどちらも同じくらいかな?

サイトによって、どちらが難しいとか書いてあったりするけど、正直、どちらも同じだよ。同じくらい面倒くさい 汗

 

上だけ見るとISMSの方がよさそうだけど、組織によっては取引条件で

「Pマークを取得していること」or「ISMSを取得していること」とか取引条件が付いていることが多いそこの協力会社、取引先(下請け)も含めて…(特に行政系はPマークの条件を課しているところが多い)

http://プライバシーマーク取得.com/privacymark-merit-demerit/nyusatsujirei.html

upfsecurity.co.jp

 

認証継続審査に落ちるとそこからの仕事が一気に0円になり、会社が傾くことも。

結構、重要…

 

社内の気を引き締める目的なら、ISMSがいいけど、取引重視なら取引先or入札先の定めている条件次第。というのが選定基準。

うちの場合で言えば、部品メーカーだけど取引先のメーカー様 がISMS指定 と言ってきているから、有無を言わさずISMSを選択。

 

 

取得コストは コンサル料+申請料金がかかるから、どちらも高い!車1台が買えるくらい…

(軽自動車~1BOXカーまで組織の大きさによって値段が変わる)

 

面倒でお金かかるけど、取引条件ついていること多いから、会社の生命線だから、やらざるを得ないんだなー

グローバル企業だとPマークお金かけてとっても日本以外では通用しないから全く意味なし

 

できればISMSに統一してくれればいいんだけどね。大は小を兼ねる・・・

範囲も広いし。でも、行政系はほとんどPマークなんだなー

 

PマークもISMSも個人情報の管理の厳しさはほぼ同じ。

グローバルに展開していて、国内の入札にも参加しようとすると両方認証とる必要あり。

これは民間には大きな負担。コストも労力も。

 

行政の入札条件 Pマーク or ISMSでいいのに。

行政はもうちょっと融通利かせてくれないかなー

 

 

これからの時代、日本でしか通用しない認証とっても意味ないんだけどなー

取引先の条件がダブっていると、両方とって車2台分お金かかったりするし。

 

最近、マルウェア、ランサムウェの被害急上昇しているから、取引条件として厳しく要求してくる会社が急増しそうな…

自社でどれだけ情報セキュリティ厳しくしても、サプライチェーンに穴があると頭隠して尻隠さずで、意味がだいぶ薄れる

 

www.bloomberg.co.jp

天下のトヨタは社内セキュリティがちがちみたいだけど、取引先多いからアキレス健サプライチェーン狙われちゃうんだなー

これとか・・・・

newswitch.jp

 

 

 

「経営のプロ」コンサルの倒産が過去最多 顧客ニーズの高度化と求められる専門性、淘汰が加速

news.yahoo.co.jp

 

「経営のプロ」コンサルの倒産が過去最多 顧客ニーズの高度化と求められる専門性、淘汰が加速

 

 

経営コンサルに直接タッチしたことはないけど、過去に経営陣がコンサル頼み で、アッチャーと思ったことがある

ネームバリューで高額コンサル料取って出す案はへっぽこばかり。

 

おまけにこのITシステム作った方がいい!とその業者に高額なシステム開発費を払って現場レベルではなんだこりゃ!とみんな総スカン

有名どころだから経営陣は信者になって、、、でたらめなコンサルに振り回されてる会社多くて陰口でてる会社多いね

経営陣相手だからみんな言わないけど。

さらにコンサル会社によっては現場の頭が切れるにテキトーな仕事が見破られないように、言葉巧みに現場の頭の切れる人を業者によるプレゼンテーションに参加させないようにしている実態、、、

 

https://youtu.be/KpUEQ0j1mbY?feature=shared

 

(社内SEネットワークあるから自分だけじゃなくあちこちの会社の現場から不満の声聞いてる)

いいカモ扱いされてたのにね

 

中にはきちんとしたところあるけど見抜くのなかなか難しいね

 

→ コンサル頼むのはいいけど、ネームバリューで判断じゃなく、よくみて良し悪し判断しようねって話

良質なコンサル増えればいいけどね

https://k5963k.hateblo.jp/entry/2024/12/26/224414

 

最近AIブームだから、なんでもかんでもすすめるのはねーコンサルのHPみるとどこもいいところしか書かず、煽ってばかり

特性上少なからず生成IAは誤情報=ハルシネーション、あるものだから得意分野 不得意分野あるのに

business.ntt-east.co.jp

ハルシネーションの大小はツールによってあるけど、100パーセントハルシネーション排除は無理

k5963k.hateblo.jp

 

ハルシネーションを完全になくすことは難しくてもプロンプトの書き方を工夫すると減らすことはできる

ここまで言う顧客のことも考えたコンサル少ないんだろうな

note.com

 

自社の利益だけでなく、顧客の利益も考えた信頼できるコンサル少ないなー

 

受注をとりたいがために、バラ色の話 虫のいい話しか、しないのはちょっと…

プラス面&マイナス面 そのマイナス面の軽減策を適切に説明して信頼で受注をとるべきですけどね。

 

なんとなく、とりとめなしにつぶやいた

 

 

経営コンサルが倒産って

経営のプロ (汗)

 

duckduckgo.com

 

 

 

 

 

 

最近出たGoogle Gemini Thinkingとは?

 

www.youtube.com

AIは日進月歩。

進化早すぎて早すぎてついていくの大変だなー

 

ChatGPTに対抗して開発中みたい。

ITは競争あると、開発競争すごいね。

 

*開発者向けだけに出している段階みたい。

 一般ユーザー向けの公開版ではないっぽい

 

開発者向けプラットフォームGoogle AI Studioでしか使えないけど

一応Google AI Studioの使い方…

miralab.co.jp

 

 

最新の機能だから、gemini thinking , gemini with deep research 両方とも上のリンクには記載なし。

 

・普通のgemini(Gemini 1.5 Pro)

 即答。チャット向き。

・Gemini Deep Research

 じっくりあちこちのサイトを調べさせてレポート作成用(約5-10分)

・Gemini Thinking

  あるお題を出して、じっくり考えさせる用(数秒~)

 いわゆる推論モデル ChatGPTo1PROの対抗 性能はほぼ同じレベルでgeminiは50%くらい考える時間が短いのが売りみたい

 

*こうかな?違うぞ! という突込みのある人はコメント欄に書いてね

 そこまでバリバリAI勉強中というわけじゃないから、いつも正しい回答とは

 限らないので…。

 

Google Thinking - chatGPT、Geminiともまだ東大入試レベルの問題を解かせるレベルは50点くらい。早慶レベル?

でも、この進化スピードならば、1年後には東大レベルになるかも

今でも、大学入試の予想問題は作ってくれそう。

 

情報処理の国家試験gemini1.5proにやらせたら8割くらい解けた

 

AIに弁護士 ちょっと前までは、そりゃないだろう! と思っていたけど、このペースなら数年後には実現できるかもね。

AIの能力なんて大したことないだろうと思っている人が多いと思うけど、今はこれほどの能力・・・・

 

ちょっとビビった。

 

forbesjapan.com

上の動画には説明なかったけど、Gemini Thinkingは、ほかのアプリの表示をGeminiに考えさせる機能もあるっぽいんですよね。

 

→ それから考えると、趣味レベルではゲーム画面をAIと共有しながら、リアルタイムで攻略方法をAIが考えられたり、リアルタイムの優秀なchatbot 、 アプリの画面をAIと連携させて、AIがアプリ、UI等の改善点を考えたり、プログラミングならコードの改善をAIに考えさせたり

www.sbbit.jp

 

そんなことできるんじゃないかな?

www.youtube.com

10:40~

 

 

 

www.youtube.com

AIの利用用途を考えるのは「現段階」では人間。

それにしても進化がすごい AI作る人は天才だねー

Chat GPTだけに注目している人多いけど、開発競争激しくてGeminiとほぼ同じレベルになって競争しているから、どちらも追った方がいいのでは?

追記: さすがにこの問題はAIもエラーはいてギブアップ 笑

 

SBGとarmが買収?検討しているampereとは

ソフトバンクGとアーム、半導体企業アンペア買収を検討=関係者

 

https://news.yahoo.co.jp/articles/e8f3b63c4878a9c878e1362055e5e1cf0584d43e

謎の半導体企業 (汗)

わからないから?どのメディアもノーコメント

うかつに「謎の半導体企業」とか書いたら炎上しそうだからまあそうなるね

 

自分もはじめて聞いた。こんな会社あったんだね

IT部品メーカーだから名前くらいは聞いたことあることが多いけど

 

https://xenospectrum.com/oracle-acquires-ampere-computing/

 

たぶんまだ未上場

chatGPT,geminiに聞いても知らない会社といわれたので、ググった

AI検索でてもググるスキルは重要

 

半導体企業は大化けすることも、海の藻屑に消えることもあるから、吉か凶かなんとも言えないね

ちなみにnvidiaも二十年前は謎の半導体企業

 

先行きわからない ハイリスクハイリターンが半導体の世界

 

 

 

にほんブログ村 IT技術ブログ IT技術メモへ
にほんブログ村 IT技術ブログ セキュリティ・暗号化へ