تفشل المنتجات الذكية أقل بكثير بسبب خطأ في النموذج، وأكثر بكثير لأن الواجهة لا تعطي المستخدمين طريقة لقراءة ثقة النظام، أو التعافي من أخطائه، أو تحديد مدى الإشراف الذي يجب الاحتفاظ به. العديد من الفرق تشحن ميزات الذكاء الاصطناعي دون خطة واضحة لأي من هذه اللحظات، والتكلفة تظهر لاحقًا كميزات مهجورة، أو ثقة مكسورة، أو التعرض للتنظيم. يغلق دليل تصميم المنتج الذكي هذا الفجوة بستة أنظمة متصلة تعمل عبر دورة حياة المنتج بالكامل، من اللقاء الأول إلى الحكم على المدى الطويل.
وفقًا لتقرير ماكنزي حول حالة الذكاء الاصطناعي، يستخدم 65% من المنظمات الذكاء الاصطناعي التوليدي في وظيفة أعمال واحدة على الأقل، ومع ذلك، الثقة، والدقة، والقدرة على التفسير لا تزال الحواجز الرئيسية لتوسيع هذه الميزات خارج الطيارات. كلا من دليل Google للأشخاص + الذكاء الاصطناعي وأدوات Microsoft HAX يحددان نفس المشكلة الجذرية: تجارب الذكاء الاصطناعي تفشل عند حدود النموذج، وليس في جوهره.
ينظم الدليل تلك المشكلات الحدودية في ستة أنظمة - الثقة، الأخطاء، التعلم، التحكم، التغذية الراجعة، والثقة.
تبدأ معظم الاعتمادات في سير العمل ذات المخاطر المنخفضة حيث يسهل عكس الأخطاء، ثم تتوسع نحو حالات الاستخدام ذات الاستقلالية العالية مع تحسن موثوقية النموذج وراحة المستخدم. يرسم منحنى البقاء الذكاء الاصطناعي هذا التقدم على محورين - تعقيد السياق وعواقب الفشل. يساعد المديرين على رؤية مكان تواجد ميزاتهم الحالية وأين يكمن حد القدرة المستقبلية.
كيفية إظهار ثقة النموذج
الثقة هي أول شيء يقرأه المستخدمين عندما يقترح الذكاء الاصطناعي نتيجة. عندما يظهر النظام اليقين بطريقة غير مباشرة، يثق المستخدمون أكثر من اللازم. عندما لا يظهر شيئًا، يفترض المستخدمون الأسوأ. يعطي النظام الأول في الدليل للفرق خيارًا منظمًا حول كيفية إظهار يقين النموذج ليناسب اللحظة، والمستخدم، ومخاطر القرار.
تظهر الأبحاث من مجموعة نيلسن نورمان أن المستخدمين إما يقبلون نتائج الذكاء الاصطناعي بدون نقد أو يرفضونها تمامًا، مع وجود قليل جدًا من الأرض المتوسطة. تكلفة الثقة المعدلة بشكل سيء هي ملموسة. في دعم القرار السريري، تم ربط الاعتماد الزائد بأخطاء التشخيص، بينما يترك الاعتماد القليل فوائد النموذج على الطاولة.
يقدم الإطار أربع طرق للتواصل بالثقة. تناسب النتائج العددية (83٪) الخبراء الذين سيتصرفون بناءً على الرقم. تناسب العلامات التصنيفية - عالية، متوسطة، منخفضة - معظم المستخدمين في معظم اللحظات ولكن يمكن أن تخفي التباين. تعمل قوائم N-best بشكل جيد للتصنيفات المبهمة ولكن تخاطر بشل الاختيار. تناسب تفسيرات التفكير لحظات المخاطر العالية ولكن يمكن أن تصبح طويلة جدًا للقراءة في اللحظة. كل خيار يحمل مخاطره الخاصة، والاختيار الصحيح يعتمد على خبرة المستخدم وتكلفة الخطأ.
ثم يرسم إطار تقويم الاعتماد حيث يجلس كل مستخدم على طيف من الاعتماد القليل إلى الاعتماد الزائد. المستخدمون الذين يعتمدون بشكل قليل يتحققون من كل اقتراح أو يتوقفون عن الأتمتة الآمنة مبكرًا.المستخدمون الذين يعتمدون بشكل مفرط يتوقفون عن مراقبة القرارات عالية المخاطر أو يفوضون التحقق بالكامل. الحالة الوسطى - الاعتماد المناسب - تصف المستخدمين الذين يشرفون ويتدخلون عندما تتطلب الحالة ذلك. تشمل التدخلات المعايرة التعلم التدريجي للثقة وإشارات الرؤية للثقة على جانب التعتمد القليل، والتحقق البشري الإلزامي أو القيود على التنفيذ المستقل على جانب التعتمد الزائد.
كيفية التعامل مع أخطاء الذكاء الاصطناعي بشكل منهجي
كل نظام ذكاء اصطناعي يفشل. الفرق بين المنتجات التي تتجاوز الفشل وتلك التي تفقد المستخدمين ليلًا وضحاها يعود إلى ما إذا كان الفريق قد خطط للفشل مسبقًا. يقدم النظام الثاني لمديري المنتجات طريقة لتعريف الأخطاء على المستوى الصحيح من التجريد ومجموعة منظمة من أنماط التعافي التي تحافظ على تدفق المستخدم سليمًا.
الخطأ الشائع هو تعريف الأخطاء إما بشكل واسع جدًا ("فشل التعرف على السائق") أو بشكل ضيق جدًا ("يفشل في التعرف على السائق الذي يرتدي نظارات شمسية عند الغروب"). التعريفات الواسعة مستحيلة التشخيص. تلك الضيقة تتكيف بشكل زائد مع حدث واحد.المستوى الصحيح - "تتراجع التعرف على السائق في ضوء الشمس والتغطية الوجهية" - يحدد حالة الفشل المتكررة التي يمكن للمهندسين اكتشافها، وقياسها، والتخفيف منها.
ثلاثة مبادئ تصميم ترسخ نظام الخطأ. رسم الأخطاء المتكررة قبل الإطلاق وتحديد مسارات الكشف، والتراجع، والتعافي. الحفاظ على التجاوز البشري بحيث يمكن للمستخدمين تصحيح، أو إعادة المحاولة، أو تصعيد، أو تجاوز قرارات الذكاء الاصطناعي عندما تكون الثقة منخفضة. الحفاظ على البشر في الحلقة على القرارات الحاسمة بحيث تظل قابلة للمراجعة، والمقاطعة، والتدقيق. هذه المبادئ تتوافق مع إرشادات مايكروسوفت HAX للتفاعل البشري-الذكاء الاصطناعي، التي تؤكد على نفس الثلاثي من معالجة الأخطاء، والتجاوز، والإشراف.
بمجرد تعريف الأخطاء، السؤال التالي هو كيف يتصرف النظام عند حدوث واحدة. يقدم الدليل خمسة أنماط للفشل اللطيف. الانتقال الناعم يعلن مسبقًا عن الفشل وينقل التحكم تدريجيًا. الهروب اليدوي يعطي مسارًا بنقرة واحدة إلى بديل غير ذكي. شرح عند إعادة المحاولة يخبر المستخدم لماذا فشلت المحاولة الأولى عندما يحاولون مرة أخرى. التعافي المرئي يحافظ على حالة النظام مرئية أثناء التعافي بدلاً من ترك الشاشة صامتة.يتحول السقوط الآمن إلى تجربة متدهورة ولكن آمنة بدلاً من الفشل الكامل.
كيفية تعليم المستخدمين على ميزات الذكاء الاصطناعي
تتشكل النماذج الذهنية للذكاء الاصطناعي في الثلاثين ثانية الأولى من الاستخدام وتستمر لعدة أشهر. إذا كان المستخدمون يتوقعون الكثير، فإن الخطأ الأول يكسر ثقتهم. إذا كانوا يتوقعون القليل جدًا، فإنهم لا يكتشفون أبدًا الميزات التي ستساعدهم فعلاً. ينشر النظام الثالث التعلم عبر رحلة المستخدم الكاملة بدلاً من الضغط في الجلسة الأولى.
تعامل معظم البرامج التعلم كحدث مرة واحدة أثناء التسجيل. المنتجات الذكية تتطلب نهجًا مختلفًا لأن سلوك النموذج ليس دائمًا قابلاً للتنبؤ، وتظهر الحالات الحافة بمرور الوقت، وينمو المستخدمون في استخدامات أكثر تقدمًا مع تطور ثقتهم. تظهر الأبحاث من مجموعة Nielsen Norman على الكشف التدريجي أن الواجهات التي تكشف عن التعقيد في مراحل تنتج على إكمال المهمة الأعلى في البرامج المعقدة، والمنتجات الذكية تناسب هذا النمط تمامًا. النتيجة هي استراتيجية تعلم تعمل للحياة الكاملة للمنتج بدلاً من العشر دقائق الأولى.
يحدد الإطار خمس لحظات تعلم. يوم 1 يحدد التوقعات من خلال شرح القدرات، بيان واضح للقيود، ووصف لأدوار الإشراف. الاستخدام المبكر يبني الثقة من خلال التفكير الظاهر، تسليط الضوء على النتائج الناجحة، وتعزيز الاستخدام الصحيح. الحالات الحافة تحفز إعادة تعيين ذهنية تشرح السلوك غير العادي، تكشف حدود النظام، وتقدم الحماية. اللحظات المتقدمة توسع الاستقلالية من خلال فتح قدرات جديدة وتقليل عبء الإشراف. الصيانة طويلة الأجل تعدل التوقعات حيث يتحسن النموذج ويتعافى من الأخطاء السابقة. كل لحظة تحمل أنماط تصميمها الخاصة ونغمة المحتوى.
كيفية إعطاء المستخدمين التحكم المتناسب
التحكم هو القرص الذي يقرر كم من الوكالة يحتفظ بها المستخدم وكم يأخذ الذكاء الاصطناعي. الكثير من الأتمتة في سياق عالي المخاطر يؤدي إلى الاعتماد الخطير. القليل جدا من الأتمتة في سياق منخفض المخاطر يضيع قيمة النموذج ويزعج المستخدمين.النظام الرابع يساعد الفرق على وضع كل قرار ذكي في النقطة الصحيحة على سلم الأتمتة وجعل التحكم الصحيح في متناول اليد في العمق الصحيح.
سلم الأتمتة ينظم القرارات الذكية في أربع مستويات. المستوى 1 يغطي التوصيات التي يمكن للمستخدم قبولها أو رفضها، مثل اقتراحات Netflix أو Spotify. المستوى 2 يغطي الاقتراحات التي تتطلب الموافقة، بما في ذلك الرسائل الإلكترونية المسودة، والموافقات على المصروفات، وتوليد الرمز. المستوى 3 يغطي التحكم المشترك، حيث يعمل الذكاء الاصطناعي ويشرف البشر، كما في مساعدة الحفاظ على الممر أو مراقبة الاحتيال. المستوى 4 يغطي التنفيذ الذاتي في المجالات ذات الأهمية العالية مثل التداول الآلي أو العلاج الطبي، حيث تكون عواقب الفشل شديدة وتتحول دور الإنسان إلى التدقيق بدلاً من الموافقة.
إطار عمل تحديد موقع التحكم المرافق يقرر أين يظهر كل تحكم في الواجهة. التحكمات التي يحتاجها المستخدمون بشكل متكرر أو في لحظات حاسمة - الإيقاف المؤقت والتوقف، محدد وضع الذكاء الاصطناعي، الصوت والكتم - تظل مكشوفة دائمًا.التحكمات التي تؤثر على السلوك ولكن لا تحتاج إلى رؤية مستمرة - تفضيلات التخصيص، إعدادات التوصية، قواعد الإشعار - تجلس على عمق قائمة واحدة. التحكم لحالات الحافة، التشخيص، أو المستخدمين القويين - تفضيلات مشاركة البيانات، اختيار النموذج، جداول الأتمتة - تختفي خلف الإعدادات الافتراضية المعقولة في الإعدادات المتقدمة. هذه الهيكلية ثلاثية المستوى تمنع الفوضى في الواجهة بينما يبقى التحكم الحاسم في متناول اليد.
كيفية تحويل كل تفاعل إلى إشارة ردود فعل
معظم المنتجات الذكية تجمع فقط الردود الصريحة - التقييمات، الشكاوى، تذاكر الدعم - وتفوت الكمية الأكبر بكثير من الإشارات الضمنية التي يولدها المستخدمون دون أن يدركوا ذلك. يعامل النظام الخامس كل عمل مستخدم كإشارة تعلم محتملة ويعطي الفرق حلقة منظمة من السلوك الخام إلى تحسين النموذج.
تشمل الردود الضمنية التجاوزات، التوصيات المتجاوزة، الجلسات المهجورة، وإعادة التوجيه. تشمل الردود الصريحة تقييمات الإبهام، الاستطلاعات المكتملة، والشكاوى المباشرة. كلا النوعين مهم.وصف مهندسو Netflix بشكل علني كيف يعتمد نظام التوصية الخاص بهم بشكل أساسي على الإشارات الضمنية - ما يشغله المستخدمون، وما يتجاوزون، وما يشاهدون مرة أخرى - لأن التغذية الراجعة الصريحة نادرة جداً ومتحيزة جداً لتحرك التخصيص على نطاق واسع.
يحول إطار عمل الحلقات الرجعية هذه الإشارات إلى تغييرات في النموذج والمنتج من خلال أربع مراحل. جمع الإشارات من التجاوزات، سلوك الاستخدام، الشكاوى، والتقييمات. تحديد الأنماط مثل انهيارات الثقة، تجمعات الاحتكاك، حوادث السلامة، وتحولات التفضيل. قياس النتائج ضد الرضا، الاعتماد، الاعتماد، والدقة. تنفيذ التغييرات من خلال الضمانات الجديدة، إعادة التدريب، تحديثات السياسة، وتحسينات UX. تعمل الحلقة بشكل مستمر، وتغذي نتائجها مرة أخرى في أنظمة الثقة، الخطأ، والتحكم الموصوفة في وقت سابق في الإطار.
كيفية بناء الثقة في المنتج
الثقة هي المنتج التراكمي لكل نظام آخر في الإطار.يمكن للفريق شحن مؤشرات الثقة المثالية، وأنماط الفشل الأنيقة، وحلقات الردود الغنية، ومع ذلك يفقد المستخدمين إذا فشل المنتج في الحصول على الموافقة، أو الشفافية، أو المساءلة. يمنح النظام السادس الفرق بنية طبقية للثقة على كل مستوى، من التفاعل الفردي إلى سمعة الشركة العامة.
تكدس هرم الثقة خمسة مبادئ من التشغيلي إلى المؤسسي. يطلب الموافقة السياقية من المستخدمين الإذن المرتبط بالإجراءات المحددة، في لحظة ظهور القيمة. يحافظ التحكم في المستخدم على قابلية الموافقة للعكس ويجعل التحكم سهل العثور عليه. يشرح توثيق النموذج قدرات النظام وينشر القيود المعروفة. يظهر الكشف السياقي استخدام البيانات ذات الصلة بلغة بسيطة داخل المنتج. تقارير المساءلة العامة تقدم النتائج بشكل مفتوح وتكشف عن الحوادث الكبرى من خلال تقارير الثقة ولوحات السلامة. الهرم هو هرمي لأن الطبقات السفلية يجب أن تعمل قبل أن تصبح الطبقات العليا موثوقة.
يغلق الدليل مع خارطة طريق متسلسلة تنقل المنظمة من التجربة المبكرة إلى العمليات الأصلية للذكاء الاصطناعي.يغطي الربع الأول استكشاف الذكاء الاصطناعي: تحديد سير العمل ذات القيمة العالية والتجارب الأولية للأدوات الداخلية. يغطي الربع الثاني القرارات المعززة بالذكاء الاصطناعي: تبني التوصيات الذكية والرؤى المدفوعة بالتغذية الراجعة المضمنة. يغطي الربع الثالث الإبداع المساعد بالذكاء الاصطناعي: مقدمة سير العمل للتصميم وتقليل الجهد اليدوي في الإنتاج. الهدف في الربع الرابع هو العمليات الأصلية للذكاء الاصطناعي: تشغيل سير العمل ذات المخاطر المنخفضة تلقائياً وتوسيع التنفيذ الذاتي. يساعد الخارطة الزمنية القادة على تسلسل الاستثمار بحيث تنضج القدرة، والحوكمة، وثقة المستخدم معًا بدلاً من الانفصال.
الأنظمة الستة تعمل كتسلسل، وليست قائمة تحقق. الفريق الذي يظهر الثقة بدون خطة للأخطاء سيفقد المستخدمين عند الفشل الأول. الفريق الذي يحدد الأخطاء بدون حلقات تغذية راجعة غنية سيستمر في تكرار نفس الأخطاء. الفريق الذي يبني التحكم والتغذية الراجعة بدون بنية ثقة أساسية سيرى تباطؤ التبني بمجرد ارتفاع الرهانات.تعامل المنظمات الذكاء الاصطناعي الناضجة مع تصميم المنتج كتخصص من الأنظمة المتداخلة بدلاً من مجموعة من الميزات، وهي تتسلسل الاستثمار بحيث تنضج الثقة، والتعافي، والإشراف، والمساءلة معًا. يحول دليل تصميم المنتج الذكاء الاصطناعي هذا التخصص إلى شيء يمكن للفرق تخطيطه، وقياسه، وشحنه. كما يمنح القادة مفردات مشتركة للمحادثات مع الشركاء الهندسيين، والقانونيين، والسياسيين، والذي يصبح أمرًا ضروريًا في اللحظة التي ينتقل فيها الميزة من التجربة إلى النطاق. تصميم المنتج للذكاء الاصطناعي لم يعد مجرد قلق UX بمفرده؛ بل هو قدرة استراتيجية تقرر ما إذا كان الاستثمار في الذكاء الاصطناعي يتراكم أو يتوقف.