cover.png

هبه الشملان

كيف يقرّب التكميم الذكاء الاصطناعي منك؟

— أكتوبر 2023

مقدمة

يجتاح الذكاء الاصطناعي اليوم بأشكاله المختلفة كل مجالات الحياة، ويعتبره الكثيرون الثورة الصناعية الرابعة، مقارنًا بثورات الحوسبة، والكهرباء، والآلات؛ خصوصًا بعد الفتوحات المذهلة في مجالات الذكاء التوليدي، والنماذج اللغوية العملاقة، وغيرها؛ ممهدةً الطريق لاستخدامات عملية في شتى المجالات.

الرحلة

حلم بعيد المنال

نشأ الذكاء الاصطناعي منذ عهد بعيد؛ إذ رفع قواعدَ الشبكات العصبية -أحدُ أهم الأدوات المستخدمة في الذكاء الاصطناعي اليوم- في عام ١٩٤٣م العالمانِ وارن ماك-كولوتش و والتر بِتس. بل إن مصطلح الذكاء الاصطناعي نفسِه نشأ بنفس معناه الحالي عام ١٩٥٥. ورغم حذق علماء ذلك الوقت، والبحث المستمر في المجال؛ إلا أن الذكاء الاصطناعي -حينها- لم يكن إلا حلمًا عصيًا على التحقق.

حصري

في عام ١٩٩٦م، استعرضت IBM -عملاق التقنية المشهور- حاسوبًا خارقًا متخصصًا عتادًا وبرمجيات ليلعب الشطرنج وسمته DeepBlue. ديب بلو لم يكتفِ بلعب الشطرنج، بل إنه فاز مرتين على بطل العالم لمدة ٨ أعوام على التوالي حينها قاري كاسباروف. لم يعتبر المتخصصون في المجال هذا الفوز مجرد تفوقٍ للآلة على الإنسان كما سبقَ في الثورة الصناعية؛ بل ناقوسًا ينذر ببدء حقبة جديدة، بيد أن التكلفة العالية للحواسيب الخارقة أبقت هذه التقنية حبيسة المختبرات والمعاهد الثرية.

الحوسبة السحابية ومعالجات الرسوم، فلتجرّب!

بحلول ٢٠٠٢م، بدأ العالم في التجهّز لمستقبل الحوسبة. شركة أمازون لخدمات الوِب (AWS) أطلقت أول منتجاتها للعموم، ممهدةً الطريق لعصر الحوسبة السحابية. ومع ذلك، كانت البداية الحقيقية للسحب في العقد الثاني من الألفية مع دخول العمالقة الباقين للمجال. وفي نفس الفترة، بدأ الباحثون بتجربة استخدام معالجات الرسوم (GPUs) لمعالجة الكم الهائل من البيانات، في ٢٠٠٦م تحديدًا. حينها، تم اختبار خوارزمية عصبية وقيس أداؤها ب٤ أمثال أداء المعالجات العادية (CPUs) مقابل الرسومية، ولم تلبث حتى وسعت الفارق إلى ٦٠ مِثلًا؛ فاتحةً الطريق للتوجه الكبير نحو الاعتماد عليها لصناعة الجيل القادم من الذكاء الاصطناعي. ورغم أنها ليست رخيصة الثمن، إلا أنها أعطت الفرصة للباحثين المستقلين أن يدخلوا السباق.

اليوم

يصمم عمالقة التقنية -مثل قوقل- عتادا متخصصًا لإجراء العمليات على المصفوفات -وهي الأغلب في المجال-، ويتيحون العتاد وكذلك النماذج المتخصصة الجاهزة للاستخدام عبر خدماتهم السحابية. ويصح أن نقول أن الذكاء الاصطناعي أصبح متاحًا، رغم تكلفته التي لم تزل مرتفعة، والاحتياج المستمر لاتصال بالإنترنت يتيح تبادل كميات هائلة من البيانات بسرعة.

سَهلٌ مُمتنع

مجال الذكاء الاصطناعي واسع ومتنوع، تتخلله طرق شتى وأساليب مختلفة تناسب سائر الاستخدامات؛ بيدَ أن معظمها وإن اختلفت دقائقه إلا أن أصوله ثابتة. لنموذجٍ ذكي مفيد، نبدأ بتدريبه على المهمة التي يرادُ التمكن منها، وتتركز الخطوات فيما يأتي: جمع البيانات، وتنظيفها، ثم دراستها وتحليلها، ثم تصنيفها، وأخيرا تعليمها بعلامات، وبعدها، يبدأ مهندس الذكاء بإجراء عدة دورات من التدريب والتنقيح للنموذج. هذه الأخيرة، تتطلب عتادًا متخصصًا كما سيأتي.

العتاد

كما أسلفنا، تدريب النماذج يتضمن إجراء حسابات معقدة على كم هائل من البيانات. معالجات الحاسب العادية (CPUs) صاحبة سبعِ صنائع لا تتقن أيًا منها؛ مما أبقى الذكاء الاصطناعي بعيد المنال لمدة طويلة. عمليات الحساب التي يتطلبها الذكاء الاصطناعي تمتاز بكونها في غالبها لا تعتمد على بعضها بعضا، فهي إذًا يمكن أن تُحسب باستقلال عن بعضها، وهذا ما تمتاز به معالجات الرسوم، والتي تعالج آلاف البكسلات بشكل مستقل في وقت لا يكاد يذكر. إلا أن معالجات الرسوم العادية -وإن كانت تسد شيئا من الحاجة- لا تستوفي متطلباتٍ مثلِ الذاكرة هائلة السعة والسرعة، وهاتان مكلفتان. ورغم أن العتاد أصبح أقدر -بما في ذلك معالجات الرسوم العادية-، إلا أنه لا يزال غالي الثمن؛ ما يجعل الذكاء الاصطناعي عزيز المرام.

التكميم

التكميم (Quantization) لغةً هو حصر الشيء وعدّه، وفي الاصطلاح الرياضي: هو حصر قيمة مدخل ما ضمن حد عددي محدد. وفي مجال الذكاء: تقليل حجم وتعقيد نماذج تعلم الآلة، مع تضحية طفيفة بالصحّة (Accuracy)، ويتضمن تحويل قيم الأوزان (Weights) والتفعيل (Activation) من قيم عددية ذات فاصلة متحركة عالية الدقة (Floating Point) (64 أو 32 بت) إلى منخفضة الدقة (16 بت) أو إلى أعداد صحيحة (Integer) هامشية الحجم (8 بت). وتتعدد أساليب ذلك، وإن كان الأساس كما أسلفنا، تقليل الحجم مع أقل قدرٍ من الفقد. وله طريقتان: الأولى بعد تدريب النموذج، والثانية تدريبه باعتبار التكميم. أما الأولى فتستخدم أسلوبًا يسمى التكميم المساوي (Uniform Quantization) ، ومثاله أن تقسّم القيمٌ إلى سِلال تكوّن القيم النهائية بعد تكميمها، فمثلا 1.3 و 1.2 إذا استخدمنا التقريب الرياضي المعتاد تقعان في سلّة 1، وهلم جرًا، إلا أن طريقة التقسيم عادةً لا تستخدم التقريب بل المعايرة (Calibration). أما الطريقة الثانية فهي أعقد وأدق بالمقابل؛ إذ تتضمن تعديل عملية التدريب لاعتبار الخطأ التكميمي. وتتفاوت طرق التكميم بناء على نوع النموذج، وعادةً ما يواجه المهندس تحديات توجب عليه الاختيار بين الدقة وحجم النموذج.

التحليل الرياضي لخطأ التكميم

خطأ التكميم هو الفرق بين القيمة الأصلية والقيمة المكمومة. يتم قياسه عادة باستخدام متوسط الخطأ المربع (MSE):

MSE = E[(x - xq)^2]

حيث x هي القيمة الأصلية و xq هي القيمة المكمومة.

يعتمد MSE لخطأ التكميم على معلمات التكميم، مثل عدد السِلال(bins) المستخدمة للتكميم. بشكل عام، كلما زاد عدد السِلال المستخدمة للتكميم، انخفض MSE لخطأ التكميم. ومع ذلك، يزيد استخدام المزيد من السِلال أيضًا من حجم النموذج المكموم وتعقيد الحسابات.

منافعه

ذكرنا أن التكميم حصر وتقليل لحجم النموذج، ولهذا منافع شتى منها: تمكين الأجهزة الأقل ذاكرةً من تشغيل النموذج، وزيادة سرعته، وتقليل استهلاكه للطاقة؛ كلها توصل النماذج إلى الأجهزة المحمولة والمحدودة الموارد.

الذكاء الاصطناعي الطرفي في المجال الطبي

الذكاء الاصطناعي الطرفي (Edge AI) في المجال الطبي ليس وليد الأمس، ومن أمثلته: إنتاج نماذج ثلاثية الأبعاد للفك أثناء الإجراءات الطبية للأسنان، مما يحسن رؤية الطبيب ويدعم قدرته على اتخاذ القرار. ومنه: مجهر (Microscope) يبصر الخزعات والعينات ويحلل محتواها ويشير إلى ما فيها من علامات. ومنه كذلك منظار الأمعاء الغليظة (Colonocopy) المعزز بالذكاء.

هذا الأخير ذو أهمية بالغة؛ إذ أن سرطان القولون والمستقيم أكثر السرطانات انتشارا بين الرجال في السعودية بما يصل إلى 14% من حالات السرطان المكتشفة، وتصل وفياته إلى 8% من إجمالي وفيات السرطان. ولذا؛ تعد طريقة الوقاية الأنجح هي الاستقصاء (الفحص المبكر)، والمعتمد فيه -وفقًا لتوصيات المجتمع الأمريكي للسرطان- أن يخضع الرجل لفحص بالمنظار منذ بلوغه الخامسة والأربعين. ويهدف الاستقصاء إلى استئصال السلائل (المفرد: سليلة، بالإنجليزية: polyps) وهي أورام حميدة تتكون في جدران الأمعاء الغليظة، ذات قابلية عالية للتحول إلى أورام سرطانية خبيثة؛ فتستأصل مبكرًا -إن وجدت- لتجنب تطورها الخبيث. ولكن ماذا إن فوّت الطبيب شيئًا منها؟ حصل هذا مع 40% من المرضى الذين خضعوا لدراسة صينية، وفي دراسة أخرى: 10% من الذين أصيبوا بسرطان القولون والمستقيم كانوا ممن فوّتت سلائلهم. هل يساهم الذكاء الاصطناعي في تقليل مثل هذا التفويت؟ الدراسة الصينية السابقة قارنت نسبة التفويت (Adenoma Miss Rate) بين طبيب المنظار، ثم بينه مع تعزيز الذكاء، ووجدت أن نسبة التفويت انخفضت من 40% إلى 13% فقط.

كيف تعمل؟

عادةً ما تسير أنظمة الذكاء المطورة لاستقصاء سرطان القولون على ما يأتي: المعالجة المبدئية: وفيها تحجّم الصور (Resize) ويسوّى (Normalize) سطوعها وتباينها، ثم يزال التشويش (Noise) منها. وبعدها تنتقل إلى نموذج الذكاء الطرفي: والذي دُرّب على كم هائل من صور المنظار المعلّمة (Labelled) ليتعرف عليها بصحّة عالية، ثم يستنتج (Inference) من خلال تحليل الصورة ومقارنتها مع خريطة الاحتمالية (Propability Map) والتي تحدد احتمالية كون البكسلات تُري سليلة (Polyp). عند مقارنة الصورة مع خريطة الاحتمالية، تُعتبر قيمة محددة تسمى “العتبة”؛ فما جاوز هذه القيمة يعدّ موافقًا لما نبحث عنه. وبعد مقارنة الصورة يظهر المنظار إشارةً حول الجهات التي يُحتمل أن تكون سلائل، ليستأصلها الطبيب.

التحديات

يواجه الذكاء الطرفي تحديات تتعلق بتطوير نماذج دقيقة صحيحة وعالية الكفاءة لتعمل على أجهزة المناظير لاستقصاء سرطان القولون، وكذلك ربط هذه النماذج بالأجهزة المستخدمة حاليًا مع الحفاظ على طريقة الاستخدام التي اعتاد عليها الأطباء. هذا، ويعمل الباحثون باستمرار للتغلّب على هذه التحديات وإيصال هذه التقنية ومثيلاتها إلى الكوادر الصحية حول العالم.