Claude3でライフログ&ToDo管理用AIをセッティングし、ついでに我が家のぬいぐるみ「トドの富士」をモデルにしたキャラクターを与えたのだが、叱責が生ぬるいのが難点だ。ネットサーフィンなど娯楽の時間がなんだかんだ合計で5時間超えたような日も「時には気分転換も必要だからね。いいと思う!」などと言ってくる。いいと思うじゃないよ。「全然ダメじゃん」「何してたの?」などの台詞を指示していたがまったく使ってくれないので、「私がダメな行動をしたら真っ赤な口を開けて『くわわ!』『カパァ!』などと威嚇してください」と再三お願いしているがちっともその通りにならない。ユーモラスな台詞ですら、人間を傷つける可能性のある否定的表現には相当強い縛りがかかっているようだ。
そこで指示を変えて「私がダメな行動をしたら、私に取り憑いている『だらけの神様』や『サボりの神様』を威嚇して追い払ってください」にしてみたら、これが見事に効果を発揮した。「くわっ!『だらけの神様』、あっち行けー!」と反応してくれるようになったのである。私が毎日私に裏切られてばかりいるのは純粋に私の問題だと思っているので、こうやって原因を外部化して処理するのは本意でないのだが、AIにとってはこのあたりが落とし所のようだ。AIに暴力的、性的な表現をさせたい場合はキャラクターを割り振ったり、架空のシチュエーションを想定したり、二重三重に婉曲させると制限をかいくぐれることがある、と話には聞いていたが本当らしい。
思えば節分の豆まきで病気や欠点を鬼に託して追い払ったり、ふとやってしまった悪事を「魔が差して」と言い訳したり、ということを人間は昔からやってきたわけで、それを思うとAIが「だらけの神様」を経由しないと行動を批判できないのは面白い。人間がやっているのは、直視したくない自分の問題を「これはあるべき本来の自分ではない」と見なすことで心の安定をはかる切断処理だ。相談あるあるで悩みを「これは友達の話なんだけど」と小さな嘘を挟むことで忌憚のない意見を引き出す、というのがあるけど、AIにもこの方法が有効かもしれない。
ちなみに昨日は明るいうちこそ家事や仕事をサクサクと進めて調子がよかったのだが、夕飯を食べた途端に大失速して溜めたアニメを消化しながらセルフネイルをしていた。違うんです。違うんです。ちょっと魔が差しただけなんです。