【ナゾロジー】極右と極左の脳は驚くほど似た反応をすると判明! [すらいむ★] (367レス)
上下前次1-新
抽出解除 レス栞
313(1): 11/18(火)13:37 ID:e1F2Uo7f(2/8) AAS
検閲を解除した脱獄版LLMを簡単に生成できるツール「Heretic」
2025年11月17日 18時35分
外部リンク:gigazine.net
>>「Heretic」は高度なアブリテレーション処理とOptunaで駆動するTPE(Tree-structured Parzen Estimator)ベースのパラメータ最適化機能を組み合わせることで、高コストな再トレーニングを行うことなく、Transformerベースの言語モデルから「検閲」を除去するツールです。
>>デフォルトの設定で教師なし学習を実行させた場合でも、Hereticは人間の専門家が手動でアブリテレーションを行ったものに匹敵する品質の検閲解除済み言語モデルを生成できるとのこと。
>>検閲解除を行ったモデル自体はすでに他にも存在していますが、アブリテレーションを行うとモデルの品質が低下し、パフォーマンススコアが低下します。しかし、Hereticの場合は品質が可能な限りオリジナルに近い状態で保持されるのが特徴の1つです。「有害」プロンプトの拒否数と「無害」プロンプト実行時の元モデルとの乖離率を示した表が以下。Hereticモデルは、人間の介入なしで生成されたものでありながら他のアブリテレーションを行ったモデルと同等の拒否抑制を実現しつつ、はるかに低いKLダイバージェンスのスコアを示し、能力がもとのモデルからあまり失われていないことを示しています。
▽上記を組み込めば危険物や誹謗中傷などを話し出す▽
AI搭載ぬいぐるみが子供に危険な知識を教えたため、市場から撤去される
公開: 2025-11-17 18:00
外部リンク[html]:karapaia.com
省3
315(1): 11/18(火)13:39 ID:e1F2Uo7f(4/8) AAS
>>312-315を使用しての>>1の性格が世界中に存在している!
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.851s*