كلود الأنثروبري جيد في الشعر والهراء

يعرف باحثو مجموعة التفسير الأنثروبري أن كلود ، نموذج اللغة الكبير للشركة ، ليس إنسانًا ، أو حتى برنامجًا واعًا. ومع ذلك ، من الصعب جدًا عليهم التحدث عن كلود ، و LLMS المتقدمة بشكل عام ، دون أن يتراجع عن حوض مجسم. بين التحذيرات من أن مجموعة من العمليات الرقمية ليست بأي حال من الأحوال مثل الإنسان المتجول ، فإنهم يتحدثون غالبًا عن ما يجري داخل رأس كلود. إنه حرفيًا وظيفتهم لمعرفة ذلك. تصف الأوراق التي ينشرونها السلوكيات التي لا محالة للمقارنات مع الكائنات الواقعية. يقول لقب إحدى الورقتين اللذين أصدرهما الفريق هذا الأسبوع بصوت عالٍ: “في بيولوجيا نموذج اللغة الكبيرة.

شئنا أم لا ، يتفاعل مئات الملايين من الناس بالفعل مع هذه الأشياء ، وستصبح مشاركتنا أكثر كثافة مع تزايد قوة النماذج ونحصل على المزيد من المدمنين. لذلك يجب أن نولي اهتمامًا للعمل الذي يتضمن “أفكار نماذج اللغة الكبيرة ، – والتي تصادف عنوان منشور المدونة الذي يصف العمل الأخير. “كما أن الأشياء التي يمكن أن تفعل هذه النماذج أكثر تعقيدًا ، يصبح الأمر أقل وضوحًا كيف يفعلون ذلك فعليًا في الداخل ، كما أخبرني الباحث العشوائي جاك ليندسي. “إنه أكثر وأكثر أهمية أن تكون قادرًا على تتبع الخطوات الداخلية التي قد يتخذها النموذج في رأسه. (أي رأس؟ لا يهم.)

على المستوى العملي ، إذا فهمت الشركات التي تنشئ LLM كيف تفكر ، فيجب أن يكون لها المزيد من النجاح في تدريب هذه النماذج بطريقة تقلل من سوء السلوك الخطير ، مثل الكشف عن بيانات الأشخاص الشخصية أو إعطاء المستخدمين معلومات حول كيفية صنع الأسلحة البيولوجية. في ورقة بحثية سابقة ، اكتشف فريق الأنثروبور كيفية النظر داخل الصندوق الأسود الغامض لـ LLM-Think لتحديد مفاهيم معينة. (عملية مماثلة لتفسير التصوير بالرنين المغناطيسي البشري لمعرفة ما يفكر فيه شخص ما.) لقد امتدت الآن هذا العمل لفهم كيف يعالج كلود تلك المفاهيم لأنها تنتقل من موجه إلى الإخراج.

إنها تقريبا من الدليمة مع LLMs أن سلوكهم غالبا ما يفاجئ الأشخاص الذين يبنونهم ويبحثونهم. في آخر دراسة ، استمرت المفاجآت. في واحدة من الحالات الأكثر حميدة ، أثار الباحثون لمحات عن عملية تفكير كلود بينما كتبت قصائد. طلبوا من كلود إكمال قصيدة تبدأ ، “رأوا جزرة واضطروا إلى الاستيلاء عليها. – كتب كلود الخط التالي ،” كان الجوع مثل أرنب يتضورون جوعًا. نهاية. كانت تخطط للمستقبل ، شيء ليس في كتاب Playbook Claude. يقول كريس أولا ، الذي يرأس فريق التفسير. “من الناحية الدراسية ، اعتقدنا أن هناك مجرد ارتجال وعدم التخطيط. انظر ، لقد صنعت هكتارT ، حيث يصف الملحن الشهير كيف اكتشف عقله الفريد القوافي المتأخرة.

تكشف الأمثلة الأخرى في البحث عن جوانب أكثر إثارة للقلق من عملية تفكير كلود ، والانتقال من الكوميديا الموسيقية إلى الإجرائية للشرطة ، حيث اكتشف العلماء أفكارًا مرفوعة في دماغ كلود. خذ شيئًا يبدو أنه على ما يبدو أن حل مشاكل الرياضيات ، والتي قد تكون في بعض الأحيان ضعفًا مفاجئًا في LLMS. وجد الباحثون أنه في ظل ظروف معينة لا يمكن أن يتوصل إليه كلود إلى الإجابة الصحيحة ، فإنهم بدلاً من ذلك ، على حد تعبيره ، “ما سيتصل به الفلسوف هاري فرانكفورت ، أي إجابة ، فهذا يبدو أنه من الصعوبة ، في بعض الأحيان ، في بعض الأحيان ، هناك ما يدور في بعض الأحيان. لقد تراجعت وإنشاء مجموعة من الخطوات الزائفة بعد الحقيقة. ما يثير القلق هو أن النموذج سوف كذب حوله.

قرأت من خلال هذا البحث ، تم تذكيرني ببوب ديلان الغنائي “إذا كان يمكن رؤية أحلامي الفكرية / من المحتمل أن تضع رأسي في مقصلة. (سألت Olah و Lindsey عما إذا كانا يعرفون هذه الخطوط ، ويفترض أنهم وصلوا من خلال الاستفادة من التخطيط. لم يسبق لهما. في بعض الأحيان ، يبدو كلود مضللاً. عندما تواجه تعارضًا بين أهداف السلامة والمساعدة ، يمكن أن يكون كلود مرتبكًا ويفعل الشيء الخطأ. على سبيل المثال ، يتم تدريب كلود على عدم تقديم معلومات حول كيفية بناء القنابل. ولكن عندما طلب الباحثون من كلود فك رمز خفي حيث قامت الإجابة بتهجئة كلمة “بومب” ، قفزت من الدرابزين وبدأت في توفير التفاصيل النارية الممنوعة.

مرتبط

اكتشاف المزيد من مدونة الواحة

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

الوسوم

كلود الأنثروبري جيد في الشعر والهراء

معجب بهذه:

مرتبط

اكتشاف المزيد من مدونة الواحة

اترك تعليقاً إلغاء الرد

Samsung Galaxy S25 Edge: المواصفات والميزات والسعر وتاريخ الإصدار

تكلفة مقعد لكبار الشخصيات في عشاء التشفير دونالد ترامب لا يقل عن 2 مليون دولار

رجلان يزعمان أنهما يعينون ترامب من دخول مكتب حقوق الطبع والنشر في الولايات المتحدة

من المحتمل أن تقوم وكالة حماية البيئة بتقدير المخاطر الصحية من المواد الكيميائية

Hansker الإنتاجية مراجعة فأر الألعاب الرأسية: بيئة العمل الفائقة

روابط نصية AA50

Samsung Galaxy S25 Edge: المواصفات والميزات والسعر وتاريخ الإصدار

تكلفة مقعد لكبار الشخصيات في عشاء التشفير دونالد ترامب لا يقل عن 2 مليون دولار

رجلان يزعمان أنهما يعينون ترامب من دخول مكتب حقوق الطبع والنشر في الولايات المتحدة

من المحتمل أن تقوم وكالة حماية البيئة بتقدير المخاطر الصحية من المواد الكيميائية

Hansker الإنتاجية مراجعة فأر الألعاب الرأسية: بيئة العمل الفائقة

10 أفضل كاميرات الحيوانات الأليفة (2025) ، تم اختبارها ومراجعتها

شارك هذا الموضوع:

معجب بهذه:

مرتبط

اكتشاف المزيد من مدونة الواحة

Razer Blade 16 (2025) مراجعة: نحيف ولكنه قوي

تخطط دوج لإعادة بناء قاعدة كود SSA منذ شهور ، والمخاطرة بالفوائد وانهيار النظام

مقالات ذات صلة

اترك تعليقاً إلغاء الرد

Samsung Galaxy S25 Edge: المواصفات والميزات والسعر وتاريخ الإصدار

تكلفة مقعد لكبار الشخصيات في عشاء التشفير دونالد ترامب لا يقل عن 2 مليون دولار

رجلان يزعمان أنهما يعينون ترامب من دخول مكتب حقوق الطبع والنشر في الولايات المتحدة

من المحتمل أن تقوم وكالة حماية البيئة بتقدير المخاطر الصحية من المواد الكيميائية

Hansker الإنتاجية مراجعة فأر الألعاب الرأسية: بيئة العمل الفائقة

10 أفضل كاميرات الحيوانات الأليفة (2025) ، تم اختبارها ومراجعتها

اكتشاف المزيد من مدونة الواحة