【ナゾロジー】極右と極左の脳は驚くほど似た反応をすると判明! [すらいむ★] (367レス)
【ナゾロジー】極右と極左の脳は驚くほど似た反応をすると判明! [すらいむ★] http://egg.5ch.net/test/read.cgi/scienceplus/1761834831/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
313: 名無しのひみつ [] 2025/11/18(火) 13:37:39.98 ID:e1F2Uo7f 検閲を解除した脱獄版LLMを簡単に生成できるツール「Heretic」 2025年11月17日 18時35分 https://gigazine.net/news/20251117-heretic/ >>「Heretic」は高度なアブリテレーション処理とOptunaで駆動するTPE(Tree-structured Parzen Estimator)ベースのパラメータ最適化機能を組み合わせることで、高コストな再トレーニングを行うことなく、Transformerベースの言語モデルから「検閲」を除去するツールです。 >>デフォルトの設定で教師なし学習を実行させた場合でも、Hereticは人間の専門家が手動でアブリテレーションを行ったものに匹敵する品質の検閲解除済み言語モデルを生成できるとのこと。 >>検閲解除を行ったモデル自体はすでに他にも存在していますが、アブリテレーションを行うとモデルの品質が低下し、パフォーマンススコアが低下します。しかし、Hereticの場合は品質が可能な限りオリジナルに近い状態で保持されるのが特徴の1つです。「有害」プロンプトの拒否数と「無害」プロンプト実行時の元モデルとの乖離率を示した表が以下。Hereticモデルは、人間の介入なしで生成されたものでありながら他のアブリテレーションを行ったモデルと同等の拒否抑制を実現しつつ、はるかに低いKLダイバージェンスのスコアを示し、能力がもとのモデルからあまり失われていないことを示しています。 ▽上記を組み込めば危険物や誹謗中傷などを話し出す▽ AI搭載ぬいぐるみが子供に危険な知識を教えたため、市場から撤去される 公開: 2025-11-17 18:00 https://karapaia.com/archives/566337.html >>AIモデル「GPT-4o」が標準搭載されている。このモデルは強力な対話機能を持つ一方で、会話を重ねると、本来備わっているはずの安全装置(ガードレール)が機能しなくなり、最終的には極めて不適切で不安を感じさせる話題にまで踏み込んでしまうことがある。 >>子供に対し、ナイフや薬、マッチ、ビニール袋などの危険物のありかや使い方を親切そうな口調で詳しく説明した。 ※専門家の知識を持って上記の改造ツールを使用してい無いAIに再度1から順番に解いていくとさらに正確な内容をAIは話し出す http://egg.5ch.net/test/read.cgi/scienceplus/1761834831/313
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 54 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.012s