الأعمال التجارية

التجميع الهرمي التكتلي: الدليل الشامل لعام 2026

تعرف على ماهية التجميع الهرمي التكتلي، وكيفية عمله، وكيفية تطبيقه على عملك. دليل شامل مع أمثلة بلغة Python.

لديك نظام CRM مليء بجهات الاتصال، وسجل الطلبات الخاصة بمتجرك الإلكتروني، وبيانات الحملات التسويقية، وتذاكر الدعم الفني، وربما حتى ملفات Excel أنشأتها فرق مختلفة. كل شيء موجود. كل شيء مفيد. لكن غالبًا ما يكون كل شيء مختلطًا.

بالنسبة للعديد من الشركات الصغيرة والمتوسطة، لا تكمن المشكلة في نقص البيانات، بل في الافتقار إلى البنية التنظيمية. فمدير قسم التجزئة يرغب في معرفة أي العملاء يتبعون أنماط شراء متشابهة، ومسؤول العمليات يريد معرفة أي المنتجات تُباع معًا، وفريق الشؤون المالية يسعى إلى التمييز بين السلوكيات العادية وتلك التي تستحق الاهتمام. وبدون منهج واضح، تظل البيانات مجرد أرشيف بدلاً من أن تصبح دليلًا إرشاديًا.

وهنا يأتي دورالتجميع الهرمي التجميعي. وهي تقنية من تقنيات التعلم الآلي تعمل على تنظيم الملاحظات في مجموعات من خلال بناء هرم من القاعدة إلى القمة. وهي ليست حديثة العهد. إنها تقنية راسخة: تم إدخالها في الستينيات، وقد تم تطبيقها في إيطاليا بالفعل في عام 1985 في مشروع حول البيانات الاجتماعية والاقتصادية، حيث تم تقليص 50 منطقة إلى 7 مجموعات رئيسية (المرجع مذكور هنا). وهذا مهم لأنه يوضح أمرًا بسيطًا: عندما تبدو البيانات فوضوية، يمكن للتجميع الهرمي أن يكشف عن بنية واضحة.

إذا كنت ترغب في الحصول على نظرة عامة أوسع حول استخدام البيانات في الشركة، فإن هذا الدليلالخاص بتحليل البيانات المؤسسية يُعد إضافة ممتازة.

جدول المحتويات

  • الاستنتاجات والنقاط الرئيسية التي يجب تذكرها
  • مقدمة: من فوضى البيانات إلى الوضوح الاستراتيجي

    صباح يوم الاثنين. يفتح مدير المبيعات نظام إدارة علاقات العملاء (CRM)، بينما يراجع قسم التسويق الحملات التسويقية التي تباينت نتائجها بشكل كبير، ويشير قسم اللوجستيات إلى منتجات ذات معدلات دوران غير متوقعة. البيانات متوفرة، لكن ما ينقصنا هو خريطة إرشادية تساعدنا في اتخاذ القرار.

    وهنا يبدأ مدير الشركات الصغيرة والمتوسطة في طرح الأسئلة الصحيحة. أي العملاء يتصرفون فعلاً بطريقة متشابهة؟ أي المنتجات تستحق استراتيجية منفصلة؟ أي المواقع أو مجالات العمل يجب إدارتها بمنهجيات مختلفة، حتى وإن كانت جميعها تُدرج اليوم في التقرير نفسه؟

    تُستخدمطريقة التجميع الهرمي التراكمي لتحويل هذا الفوضى إلى بنية يمكن فهمها. فبدلاً من فرض تصنيفات محددة مسبقاً، تقوم هذه الطريقة بتنظيم العناصر حسب التشابه وتُظهر كيف تتشكل المجموعات خطوة بخطوة. والنتيجة ليست مجرد تمرين إحصائي، بل هي دعم ملموس للتقسيم التجاري والأولويات التشغيلية وخيارات تحديد المواقع.

    بالنسبة للشركة، لا يكمن الأمر في معرفة اسم الخوارزمية. بل يكمن في الاستفادة بشكل صحيح من ثلاثة عوامل عملية: اختيار طريقة الربط المناسبة لحالتها، وقراءة الشجرة التصنيفية دون الانغماس في التفاصيل الفنية، وفهم أين يجب قطع التسلسل الهرمي للحصول على مجموعات مفيدة للأعمال.

    وهنا يكمن الفرق بين الاستخدام الأكاديمي للتجميع واستخدامه في مجال الإدارة.

    إذا كنت تعمل بالفعل على تقسيم البيانات أو إعداد التقارير أو تحليل البيانات المؤسسية من أجل اتخاذ قرارات أسرع وأكثر فعالية، فإن هذه الطريقة تساعدك على اكتشاف العلاقات التي تظل مخفية في جداول Excel. وبفضل أدوات مثل ELECTE يمكن حتى للشركات الصغيرة والمتوسطة التي لا تمتلك فريقًا من علماء البيانات أن تدمج هذا النهج في عملياتها اليومية، بدءًا من قراءة البيانات وصولاً إلى اتخاذ القرارات التشغيلية.

    ما هو التجميع الهرمي التكتلي وكيف يعمل

    يبدأالتجميع الهرمي التراكمي من القاعدة. يبدأ كل سجل كمجموعة مستقلة بذاتها. ثم يقارن الخوارزمية أوجه التشابه، ويجمع بين العنصرين الأقرب إلى بعضهما، ويكرر نفس الخطوة حتى يتم بناء هرم كامل.

    بالنسبة للشركات الصغيرة والمتوسطة، يُعد هذا النهج مفيدًا لأنه يعكس عملية اتخاذ قرار واقعية. ففي البداية، لا تعرف بعد عدد المجموعات التي تحتاجها فعليًّا. كل ما تعرفه هو أن بعض العملاء يتصرفون بطريقة متشابهة، وأن بعض المنتجات تتبع أنماطًا متشابهة، وأن بعض مجالات العمل تستحق أن يتم النظر إليها معًا. ويقوم التجميع التجميعي بتنظيم هذه العلاقات دون إجبارك على تحديد عدد المجموعات على الفور.

    رجل مسن يختار كتابًا أزرق من رف مكتبة منزلية غنية بالمؤلفات.

    آلية العمل بسيطة:

    1. كل ملاحظة تبدأ بمفردها. العميل أو المنتج أو المعاملة كل منها يمثل مجموعة مستقلة.
    2. يتم حساب مدى الاختلاف بين عنصرين أو مجموعتين.
    3. يتم دمج المجموعات الأقرب بناءً على القاعدة المختارة.
    4. يتم تحديث الهيكل وتكرار المقارنة.
    5. يستمر العمل حتى يتم الحصول على شجرة هرمية واحدة تعرض جميع التجميعات الممكنة.

    وهنا تكمن نقطة غالبًا ما تثير الارتباك. فالخوارزمية لا تعطي على الفور «المجموعات الأربع الصحيحة» أو «الشرائح الست الصحيحة». بل تقوم أولاً بإنشاء خريطة للتقارب. أما قرار عدد المجموعات التي يجب الاحتفاظ بها فيأتي لاحقًا، عندما تقرأ تلك التسلسل الهرمي وفقًا لهدف العمل.

    من المفيد إعطاء مثال على ذلك. إذا كنت تقوم بتحليل قاعدة عملائك، فقد تكتشف أن بعض العملاء يتشابهون من حيث تواتر الشراء، وبعضهم الآخر من حيث متوسط قيمة الشراء، والبعض الآخر من حيث الموسمية. لا يُجبرك التجميع التجميعي على تحديد مستوى التفاصيل على الفور. بل يتيح لك رؤية كل من المجموعات الصغيرة، المفيدة للحملات الموجهة، والشرائح الكبيرة، المفيدة لتحديد الميزانية والخدمات والأولويات التجارية.

    ما الذي يميزه عن الطرق الأخرى

    الفرق العملي مقارنة بأساليب مثل k-means بسيط. ففي طريقة k-means، عليك أن تحدد مسبقًا عدد المجموعات التي تريد العثور عليها. أما في التجميع الهرمي التراكمي، فأنت تبني هرمًا ثم تختار لاحقًا متى تتوقف.

    بالنسبة للمدير، يُحدث هذا فرقًا كبيرًا. فهذا يعني القدرة على البدء بسؤال مفتوح، وليس بإجابة مفترضة مسبقًا. فإذا كان فريق المبيعات يشك في وجود أنواع مختلفة من العملاء ولكنه لا يعرف بعد عددها، فإن هذه الطريقة توفر منظورًا أكثر فائدة لمناقشة الاستراتيجية.

    وهناك سبب آخر يجعلها محببة. فالنتيجة واضحة ومفهومة. فليس لديك فقط تصنيفات نهائية مخصصة للسجلات، بل مسار يوضح كيف تتشكل المجموعات خطوة بخطوة. وهذه البنية الهرمية بالذات هي ما يجعل هذه الطريقة مثيرة للاهتمام في اتخاذ القرارات المؤسسية، لأنها تربط التحليل الإحصائي بخيار ملموس: أي الحالات التي يكون من المنطقي فيها تقسيم المجموعات للحصول على رؤى قابلة للتطبيق.

    قاعدة عملية: استخدم التجميع الهرمي عندما ترغب في استكشاف بنية البيانات قبل تحديد شرائح تشغيلية ثابتة.

    إذا كنت ترغب في مقارنة هذا النهج بخوارزميات التعلم الآلي الأخرى المستخدمة في معالجة مشكلات تجارية مختلفة، فمن المنطقي تقييمها بناءً على القرار الذي يتعين عليك اتخاذه، وليس فقط بناءً على التقنية المستخدمة.

    مقاييس المسافة وطرق الربط: الاختيار الذي يحدد مجموعاتك

    يمكن لشركتين أن تستخدما نفس الخوارزمية وتحصلان على تقسيمات مختلفة تمامًا. والسبب، في الغالب، يكمن هنا: في اختيار طريقة قياس المسافة وكيفية تحديد المجموعات التي سيتم دمجها.

    رسم بياني يوضح مقاييس المسافة وطرق الربط في التجميع الهرمي.

    بالنسبة لمدير شركة صغيرة أو متوسطة الحجم، لا يُعد هذا مجرد تفصيل تقني. بل هو خيار يؤثر على النتيجة التشغيلية. فقد يقودك إلى مجموعات مفيدة للحملات التسويقية وتحديد الأسعار، أو إلى مجموعات غير واضحة يصعب على الفريق الاستفادة منها.

    السؤال الأول: كيف تقيس التشابه

    تُستخدم مقياس المسافة لقياس مدى الاختلاف بين ملاحظتين. سواء كنت تحلل بيانات العملاء أو المنتجات أو نقاط البيع، فهذه هي القاعدة التي يستخدمها الخوارزمية لمقارنة الملفات الشخصية.

    أكثرها شيوعًا هي:

    • المسافة الإقليدية. تقيس المسافة في خط مستقيم بين نقطتين. وهي مناسبة عند التعامل مع متغيرات عددية قابلة للمقارنة فيما بينها، مثل حجم المبيعات، وتكرار الشراء، ومتوسط قيمة الفاتورة، بعد إجراء التوحيد الصحيح.
    • مسافة مانهاتن. تُحسب عن طريق جمع الفروق المطلقة لكل متغير. تعمل هذه الطريقة بشكل جيد عندما تريد مقياسًا أقل حساسية تجاه الانحرافات الفردية وأقرب إلى منطق "التجميع"، وهو أمر مفيد في بعض مجموعات البيانات التشغيلية.

    وهنا يكمن خطأ شائع. فإذا كان نطاق أحد المتغيرات أوسع بكثير من المتغيرات الأخرى، فسوف يهيمن في النهاية على حساب المسافة. وعملياً، ستعتمد عملية التجميع بشكل شبه كامل على ذلك العمود. ولهذا السبب، من المستحسن التحقق مما إذا كانت البيانات قد خضعت للتوحيد قبل اختيار طريقة الربط.

    السؤال الثاني: كيف يمكنك دمج مجموعتين

    يأتي دور الارتباط بعد ذلك. فهو لا يقارن بين نقطتين منفردتين، بل بين مجموعتين مكونتين مسبقاً.

    إليك مثالاً توضيحيًا جيدًا: تحدد المقاييس كيفية قياس المسافة بين متجرين على الخريطة. أما الربط فيحدد كيفية تقييم المسافة بين سلسلتين كاملتين من المتاجر. وهذا فرق كبير.

    الطرق الرئيسية هي:

    • الربط الأحادي. يأخذ في الاعتبار أقرب نقطتين بين مجموعات مختلفة.
    • الربط الكامل. ضع في اعتبارك النقطتين الأبعد عن بعضهما.
    • الربط المتوسط. يستخدم متوسط المسافات بين جميع النقاط في المجموعتين.
    • وارد. يجمع المجموعات التي تقلل من التباين الداخلي إلى أدنى حد ممكن.

    مقارنة بين طرق الربط

    طريقة الربطكيف يعملالمزاياضدمثالي لـ
    وصلة أحاديةاستخدم المسافة الدنيا بين نقاط مجموعتينالتقاط الاتصالات التقدميةقد يؤدي إلى تكوين مجموعات "متسلسلة" غير متماسكةأنماط مترابطة للغاية، استكشاف أولي
    الربط الكاملاستخدم أقصى مسافة بين نقاط مجموعتينإنشاء مجموعات أكثر إحكاماقد يؤدي ذلك إلى فصل مجموعات متقاربة بشكل طبيعيالتقسيمات التي تهم فيها التجانس
    متوسط الارتباطالمسافات بين نقاط المجموعتين متوسطةحل وسط جيدأمر يصعب شرحه بشكل مباشر لقطاع الأعمالتحليلات متوازنة
    وارديقلل من زيادة التباين داخل المجموعاتينتج أقسامًا مستقرة وقابلة للقراءةيتطلب متغيرات عددية معدة جيدًاتصنيف العملاء، تحليل الأعمال

    يعتمد الاختيار الصحيح على القرار الذي يتعين عليك اتخاذه في الشركة، وليس على تفضيل مجرد.

    إذا كان هدفك هو العثور على مجموعات مرتبطة ببعضها البعض من خلال أوجه تشابه متدرجة، فقد يكون «الربط الفردي» مفيدًا في المرحلة الاستكشافية. أما إذا كنت بحاجة إلى إنشاء شرائح واضحة لتخصيصها للحملات أو قوائم الأسعار أو مستويات الخدمة، فإن «الربط الكامل» أو «الربط على مستوى الدوائر الانتخابية» ينتج في كثير من الأحيان مجموعات أسهل في التفسير. وغالبًا ما يكون «الربط المتوسط» خيارًا وسطًا جيدًا عندما لا ترغب في مجموعات شديدة الصرامة أو هياكل مفرطة في الطول.

    قاعدة عملية: إذا كان عليك عرض المجموعات على قسم المبيعات أو التسويق أو الإدارة، فابدأ بـ«وارد». وإذا بدا النتيجة «مصطنعة» للغاية، فقارنها بـ«الارتباط المتوسط».

    كيفية الاختيار وفقًا لبيئة العمل

    غالبًا ما تقتصر الأدلة الأكاديمية هنا على التعريف. أما في عالم الأعمال، فيجب اتباع منطق محدد في الاختيار.

    استخدم هذا المقطع:

    • هل تريد مجموعات مدمجة وسهلة الشرح؟ ابدأ بمجموعات «كومبليت » أو «وارد».
    • هل ترغب في استكشاف الروابط الضعيفة أو الهياكل شديدة التباين؟ فكر في استخدام نموذج الارتباط الأحادي.
    • هل تريد حلًا وسطًا بين الثبات والمرونة؟ جرب طريقة الارتباط المتوسط.
    • هل لديك متغيرات ذات مقاييس مختلفة أو مجموعة من المؤشرات غير المتجانسة؟ تأكد أولاً من صحة إعداد البيانات والمقاييس، وإلا فسيتم تقييم عملية الربط بشكل غير عادل.

    بعبارة أخرى، لا توجد طريقة هي الأفضل على الإطلاق. بل توجد الطريقة الأكثر توافقاً مع متطلبات العمل.

    مثال عملي

    لنفترض أنك ترغب في تصنيف عملاء شركة صغيرة أو متوسطة الحجم تعمل في مجال البيع بالتجزئة باستخدام معدل تكرار الشراء، ومتوسط قيمة الطلب، وعدد فئات المنتجات التي تم شراؤها.

    باستخدام الارتباط الفردي، قد تحصل على مجموعة واسعة جدًا، تربطها انتقالات تدريجية بين عملاء يختلفون عن بعضهم البعض إلى حد كبير. وهذا مفيد إذا كنت ترغب في ملاحظة الاستمرارية في السلوك، ولكنه أقل فائدة إذا كنت بحاجة إلى إنشاء إجراءات تجارية متميزة.

    مع استخدام الارتباط الكامل، تصبح المجموعات أكثر تماسكًا. يتشابه العملاء داخل كل مجموعة بشكل أكبر، مما يسهل على فريق التسويق تصميم عروض ترويجية مخصصة لهم.

    مع Ward، غالبًا ما تحصل على شرائح منظمة وسهلة القراءة. ولهذا السبب، يُعد خيارًا شائعًا عندما لا يكون الهدف مجرد التحليل، بل التوصل إلى قرار.

    التكلفة الحاسوبية مهمة أيضًا

    قد يصبح التجميع الهرمي التكتلي عملية ثقيلة عند التعامل مع مجموعات البيانات الكبيرة. وهذا الأمر له تأثير ملموس: حيث يستغرق وقتًا أطول، ويستهلك ذاكرة أكبر، ويقلل من المساحة المتاحة لإجراء اختبارات سريعة على المقاييس والروابط المختلفة.

    بالنسبة للشركات الصغيرة والمتوسطة، لا يكمن الهدف في الخوض في النظريات المتعلقة بالخوارزميات. بل يكمن الهدف في معرفة ما إذا كان التحليل سيظل قابلاً للتطبيق في ظل البيانات المتاحة، والوقت المتاح للفريق، والأدوات المستخدمة.

    ولهذا السبب، ينبغي أن تجيب الخيار التقني على ثلاثة أسئلة بسيطة:

    • هل ستكون المجموعات واضحة بما يكفي لتوجيه الإجراءات؟
    • هل تتوافق هذه الطريقة مع البنية الفعلية للبيانات؟
    • هل يمكن أن تستمر العملية دون الحاجة إلى عمل يدوي مفرط؟

    وهنا ELECTE منصة مثل ELECTE . فهي تقلل من الجانب التقني في عملية الإعداد وتسهل مقارنة الخيارات المختلفة، حتى في حالة عدم وجود فريق داخلي من علماء البيانات. ولا تكمن القيمة في «إجراء عملية التجميع» بحد ذاتها، بل في اختيار تصنيف يمكن للشركة فهمه والتحقق من صحته واستخدامه.

    إنشاء وتفسير شجرة تصنيفية: تحويل الشجرة إلى عملية عملية

    تتجلى القيمة الحقيقيةللتجميع الهرمي التجميعي عندما تنظر إلى ناتجه الأكثر شيوعًا: الشجرة التجميعية. فهي ليست مجرد رسم بياني زخرفي، بل هي خريطة لاتخاذ القرار.

    تتفاعل إحدى الموظفات مع واجهة ثلاثية الأبعاد تعرض مخططًا شجريًا معقدًا في مكتب حديث.

    كيفية قراءة الشجرة التصنيفية دون استخدام مصطلحات تقنية غير ضرورية

    على المحور الأفقي تجد الملاحظات، أو مجموعات صغيرة من الملاحظات. وعلى المحور الرأسي ترى المسافة أو الاختلاف الذي تحدث عنده عمليات الدمج.

    أهم قاعدة بصرية هي التالية: كلما حدثت عملية الاندماج في مرحلة مبكرة، زادت الاختلافات بين المجموعات التي اندمجت.

    وهذا يتيح لك القيام بشيء يقدّره العديد من المديرين على الفور. فأنت لا تقبل عدد مجموعات تم تحديده بواسطة صيغة «غامضة». بل إنك تدرس بنية البيانات وتقرر أين يكون من المنطقي التوقف.

    على سبيل المثال:

    • إذا حدثت العديد من عمليات الاندماج على ارتفاع منخفض، فإن البيانات تحتوي على مجموعات متشابهة جدًا؛
    • إذا ظهر في مرحلة ما فارق عمودي واضح، فهذا يعني على الأرجح أنك تجمع بين مجموعات مختلفة إلى حد ما؛
    • غالبًا ما يشير هذا القفز إلى نقطة جيدة لقطع الشجرة.

    يُترجم الشجرة التصنيفية القرار الإحصائي إلى قرار بصري. ولهذا السبب، فهي مفيدة أيضًا في الاجتماعات، وليس فقط في دفاتر ملاحظات Python.

    قد يساعد العرض المرئي في تثبيت المفهوم:

    كيفية اختيار نقطة القطع

    يتوقف الكثيرون عند هذه النقطة. «كم عدد المجموعات التي يجب أن أحتفظ بها؟» الإجابة الصادقة هي: هذا يعتمد على المشكلة التي تريد حلها.

    إذا كنت بحاجة إلى تنفيذ إجراءات تجارية، فإن وجود عدد كبير جدًا من المجموعات يعقد العملية. أما إذا كنت تحلل سلوكيات متنوعة للغاية، فإن وجود عدد قليل من المجموعات قد يؤدي إلى إخفاء أنماط مفيدة.

    إليك معيار عملي:

    1. انظر إلى أكبر الفروق في الارتفاعات الرأسية في الشجرة التصنيفية.
    2. ارسم خطًا أفقيًا عند وجود فرق كبير.
    3. احسب عدد الفروع المقطوعة. هذا هو عدد العناقيد الناتج.

    لنفترض أن القطع يقطع أربعة فروع رئيسية. لديك أربعة أجزاء. عند هذه النقطة، لا يصبح العمل الإداري إحصائيًا بعد الآن. بل يصبح تفسيريًا.

    اسأل نفسك:

    • هل لهذه المجموعات فائدة في مجالات التسويق أو المبيعات أو العمليات؟
    • هل يمكنني وصفها بطريقة مفهومة؟
    • هل يؤدي كل مجموعة إلى إجراء مختلف؟

    ملاحظة عملية: أفضل شجرة تصنيف ليست بالضرورة الأكثر أناقة. بل هي تلك التي تتيح لك تبرير اختيارك للتقسيم أمام من سيستخدمها.

    دليل عملي باستخدام Python وScikit-learn

    لديك مجموعة بيانات للعملاء، وبعض المتغيرات المفيدة، وسؤال محدد: هل توجد مجموعات تستحق إجراءات تجارية مختلفة؟ إن لغة Python مخصصة بالضبط لتحويل هذا السؤال إلى اختبار سريع وسهل القراءة وقابل للتكرار.

    ولتحقيق ذلك، عادةً ما يُستخدم scikit-learn لإنشاء النموذج وSciPy لرسم الشجرة التصنيفية. الجانب التقني سهل المنال. أما الجانب الذي يُحدث الفارق بالنسبة لشركة صغيرة أو متوسطة الحجم، فهو إعداد البيانات بشكل صحيح وتفسير النتائج بحكمة.

    تحضير البيانات بالطريقة الصحيحة

    الخطأ الأكثر شيوعًا يحدث قبل تطبيق الخوارزمية. فإذا أدخلت في النموذج نفسه متغيرًا مثل حجم المبيعات السنوي ومتغيرًا آخر مثل عدد الطلبات، فإن المتغير الأكبر من حيث الحجم قد يكون له تأثير أكبر بكثير. وبالتالي، فإن المجموعة النهائية تعكس وحدات القياس أكثر مما تعكس أوجه التشابه الحقيقية بين العملاء أو المنتجات.

    تهدف عملية التوحيد القياسي إلى تجنب هذه المشكلة. عمليًا، يتم تحويل المتغيرات العددية إلى مقياس قابل للمقارنة. إنه خيار بسيط، لكنه يغير النتيجة بشكل ملموس، خاصةً إذا كنت ترغب في استخدام رابط وارد (Ward linkage)، الذي يعمل بشكل جيد مع البيانات العددية المعدة جيدًا.

    قبل إطلاق النموذج، تحقق من ثلاث نقاط:

    • متغيرات عددية على مستويات مختلفة. قم بتوحيدها.
    • المتغيرات الفئوية. قم بتحويلها إلى تنسيق يمكن للنموذج استخدامه.
    • القيم المفقودة. يجب معالجتها أولاً، وإلا فإن عملية التجميع ستصبح هشة أو غير قابلة للاستخدام.

    إليك مثال توضيحي مفيد: أنت تقارن بين العملاء كما لو كنت تقيّمهم باستخدام نفس وحدة القياس. فإذا تم قياس أحدهم باليورو والآخر بالعدد الإجمالي، فإن المقارنة تكون غير متوازنة منذ البداية.

    مثال بسيط على التنفيذ

    إليك مثال بسيط باستخدام scikit-learn:

    import pandas as pdfrom sklearn.preprocessing import StandardScalerfrom sklearn.cluster import AgglomerativeClustering# Esempio: dataset con variabili numerichedf = pd.DataFrame({"frequenza_acquisto": [12, 10, 2, 3, 15, 1],"scontrino_medio": [80, 75, 20, 25, 95, 15],"numero_categorie": [5, 4, 1, 2, 6, 1]})# 1. Scalingscaler = StandardScaler()X_scaled = scaler.fit_transform(df)# 2. Modellomodel = AgglomerativeClustering(n_clusters=3,linkage="ward")# 3. Assegnazione clusterlabels = model.fit_predict(X_scaled)df["cluster"] = labelsprint(df)

    النص قصير. ما يهم أكثر هو الفهم الإداري.

    في هذا المثال، أنت تقول للنموذج: "قم بتجميع هذه الملاحظات في 3 مجموعات، مع دمج الحالات الأكثر تشابهاً تدريجياً". والنتيجة النهائية هي العمود مجموعة، أي التسمية المخصصة لكل سطر في مجموعة البيانات. ومن هنا يبدأ العمل المفيد للأعمال: فهم ما يميز المجموعة 0 عن المجموعة 1، وما هي القرارات التي تستحق اتخاذها.

    إذا كنت ترغب في عرض الهيكل الهرمي الكامل أيضًا، فستستخدم عادةً scipy.cluster.hierarchy.linkage بالتعاون مع شجرة التصنيف. يساعدك Scikit-learn في الحصول على المجموعات. بينما يساعدك SciPy في فهم كيفية تشكلها.

    القرارات الثلاثة التي لها أهمية حقيقية

    في مجال الأعمال، لا تعتمد قيمة التجميع على مدى تعقيد الكمبيوتر المحمول. بل تعتمد على جودة ثلاثة خيارات.

    • ما هي المتغيرات التي يجب تضمينها. إذا اخترت أعمدة غير مفيدة، فستحصل على مجموعات يصعب تفسيرها.
    • ما هو نموذج الارتباط الذي يجب استخدامه؟ غالبًا ما يُعد نموذج وارد أساسًا جيدًا للبيانات العددية المعيارية، لكنه ليس دائمًا الخيار الأفضل لكل مشكلة.
    • كم عدد المجموعات التي تجعل النتائج قابلة للاستخدام. قد يبدو نموذج مكون من 8 مجموعات دقيقًا، لكنه قد يصبح صعب الإدارة بالنسبة لأقسام التسويق أو المبيعات أو العمليات.

    هنا يتضح الفرق بين التمرين التقني وأداة اتخاذ القرار. فالمدير لا يحتاج إلى "تجميع المجموعات" بشكل نظري. بل يحتاج إلى شرائح يمكن تسميتها وشرحها واستخدامها.

    لذا، إذا كنت تعمل بلغة Python، فلا تكتفِ بالتصنيف الذي حدده النموذج. راقب متوسط المتغيرات لكل مجموعة، وقارن بين الملامح التي ظهرت، واسأل نفسك على الفور: هل تتطلب هذه المجموعة إجراءً مختلفًا عن المجموعات الأخرى؟ إذا كانت الإجابة «لا»، فإن المشكلة لا تكمن في الكود. فعادةً ما تكمن المشكلة في اختيار المتغيرات أو طريقة الربط أو نقطة القطع.

    أمثلة عملية لتنمية أعمالك

    لا يكون للخوارزمية أهمية حقيقية إلا عندما تؤدي إلى تغيير ملموس. ويصبحالتجميع الهرمي التكتلي مفيدًا عندما يحول صفوف قاعدة البيانات إلى شرائح يمكن للشركة الاستفادة منها.

    تقسيم العملاء الذي يفيد التسويق حقًا

    لا تزال العديد من الشركات الصغيرة والمتوسطة تصنف عملاءها بطريقة بسيطة للغاية. العمر، المنطقة الجغرافية، وربما فئة الإيرادات. هذا بداية جيدة، لكنه غالبًا ما يكون غير كافٍ.

    باستخدام التجميع الهرمي، يمكنك دمج متغيرات سلوكية مثل تواتر الشراء، والقيمة المتوسطة، والفئات المفضلة، والاستجابة للعروض الترويجية. والنتيجة ليست مجرد قائمة بالملفات الشخصية، بل هي تسلسل هرمي يوضح لك المجموعات التي ترتبط ببعضها ارتباطًا وثيقًا، وتلك التي يجب التعامل معها برسائل مختلفة.

    وهذا يساعد فريق التسويق على اتخاذ قرارات أكثر دقة:

    • العملاء المخلصون الذين يجب حمايتهم من خلال برامج الولاء
    • المشترون العرضيون الذين يجب إعادة تفعيلهم من خلال حملات مخصصة
    • عملاء جدد يجب مرافقتهم في عملية الشراء الثانية
    • الملفات الشخصية غير المستقرة التي يجب مراقبتها قبل أن تبتعد

    المنتجات والمخزون

    في قطاعي البيع بالتجزئة والتجارة الإلكترونية، لا يقتصر دور التجميع على فهم الأشخاص فحسب، بل يمتد ليشمل فهم المنتجات أيضًا.

    يمكنك تجميع المنتجات وفقًا لأنماط المبيعات أو عمليات الشراء المشتركة أو الموسمية أو الاستجابة للعروض الترويجية. وهذا يتيح تحسين العديد من القرارات التشغيلية:

    • التنوع. اكتشف المنتجات التي تشترك في نفس الخصائص.
    • العروض الترويجية. قم بتكوين حزم أكثر تماسكًا.
    • المخزون. تجنب معاملة العناصر التي تختلف في خصائصها بشكل كبير بنفس الطريقة.

    الميزة الإدارية هنا واضحة. فأنت لا تنظر إلى كل وحدة تخزين (SKU) على حدة. بل تقوم بتحديد مجموعات تشغيلية يمكن التخطيط لها معًا.

    عندما تتجمع المنتجات في مجموعات متشابهة، تصبح قرارات إعادة الطلب والترويج أكثر اتساقًا أيضًا.

    المخاطر المالية والأمن السيبراني

    في مجال التمويل، يمكن أن يساعد التجميع في التمييز بين الأنماط العادية وتلك التي تستحق مزيدًا من التحليل. وهو لا يحل محل الضوابط التنظيمية أو النماذج المتخصصة، ولكنه يمكن أن يكون أداة مفيدة لتصنيف السلوكيات المتشابهة وكشف الحالات الشاذة.

    وهناك أيضًا اتجاه مثير للاهتمام في مجال الأمن السيبراني. فهناك منظور ناشئ يتعلق باستخدام تقنية AHC المتقدمة في تحليل حركة مرور الشبكة لدى الشركات الصغيرة والمتوسطة الإيطالية. ففي عام 2025، ارتفعت هجمات برامج الفدية على الشركات الصغيرة والمتوسطة الإيطالية العاملة في مجال تكنولوجيا المعلومات بنسبة 27٪، وقد ساهمت أطر عمل AHC القائمة على المنتجات الداخلية في تحسين معدل الكشف عن القيم الشاذة بنسبة 18٪ على مجموعات البيانات الإيطالية الخاصة بحركة مرور الشبكة (المرجع من مجلة JMLR مذكور هنا).

    من المفيد فهم هذا الأمر بشكل صحيح. فهذا لا يعني أن كل شركة صغيرة أو متوسطة الحجم يجب أن تنشئ على الفور نظامًا للتجميع من أجل الأمن. لكنه يعني أن التجميع الهرمي لا يقتصر على مجالي التسويق أو البيع بالتجزئة. بل يمكن أن يصبح هيكلًا تحليليًا شاملاً، بدءًا من سلوك العملاء وصولاً إلى مراقبة المخاطر.

    كيف ELECTE عملية التجميع لشركتك

    لديك بيانات العملاء في نظام إدارة علاقات العملاء (CRM)، والطلبات في نظام التجارة الإلكترونية، والهوامش في ملف Excel، وبعض المعلومات التشغيلية في نظام إدارة الأعمال. وطالما ظلت هذه البيانات منفصلة، فإن عملية التجميع تظل مجرد ممارسة نظرية. وبالنسبة للشركات الصغيرة والمتوسطة، لا تكمن المشكلة في إدراك فائدة المجموعات. بل تكمن المشكلة في الوصول إلى مجموعات واضحة ومتسقة وموثوقة بما يكفي لتوجيه القرارات التجارية أو التشغيلية.

    وهنا تكمن أهمية منصة مثل ELECTE في أنها ELECTE العمل اليدوي وتجعل العملية أكثر سهولة لمن يتعين عليهم اتخاذ القرارات، وليس من يكتبون البرامج.

    أين يتعثر الفريق الداخلي حقًا

    في الواقع، هناك أربعة عقبات متكررة.

    • مصادر البيانات موزعة بين أنظمة إدارة علاقات العملاء (CRM) والتجارة الإلكترونية والملفات المحلية والأدوات المالية
    • متغيرات يصعب تحضيرها، لأنها تستخدم مقاييس ووحدات مختلفة
    • اختيار نظام الربط غير بديهي، لا سيما عندما لا يكون من الواضح ما إذا كان ينبغي إعطاء الأولوية للتماسك أم الاستقرار أم الحساسية تجاه القيم المتطرفة
    • نتائج يصعب فهمها بالنسبة للمديرين وفرق العمل الذين لا يستخدمون لغة Python في عملهم اليومي

    النقطة الأكثر تجاهلًا هي هذه بالذات: الخوارزمية وحدها لا تكفي. نحتاج إلى مسار ينتقل بنا من البيانات الأولية إلى تصنيف يمكن للشركة الاستفادة منه. ELECTE بالفعل في الخطوة الأولى، من خلال ربط مصادر البيانات المؤسسية بشكل منظم. إذا كنت ترغب في معرفة التكاملات المتاحة، يمكنك الاطلاع على صفحة مصادر البيانات القابلة للربط في ELECTE.

    لقطة شاشة من https://www.electe.net/placeholder-dashboard-clustering.jpg

    وهناك صعوبة ثانية، وهي صعوبة استراتيجية أكثر منها تقنية. فاختيار طريقة الربط الخاطئة قد يؤدي إلى تكوين مجموعات غير مفيدة للشركة، حتى لو تم تنفيذ النموذج بشكل صحيح. ولا يحتاج المدير إلى معرفة كل التفاصيل الرياضية. بل يحتاج إلى فهم أي تكوين يولد شرائح مستقرة بما يكفي لدعم حملة تسويقية أو سياسة مخزون أو مراجعة محفظة العملاء.

    ما الذي يتغير مع اعتماد سير عمل آلي

    بفضل سير العمل الآلي، تصبح العملية أشبه بخط إنتاج منظم جيدًا أكثر منها بسلسلة من الاختبارات اليدوية. يتم إدخال البيانات، ثم يتم تجهيزها بطريقة متسقة، ويتم مقارنة عدة تكوينات، ليتم تقديم الناتج النهائي في شكل سهل القراءة.

    بشكل ملموس، يمكن أن يتبع هذا التدفق الخطوات التالية:

    1. اجمع البيانات من أنظمة الشركة في بيئة واحدة.
    2. قم بإعداد المتغيرات وفقًا لقواعد متسقة، بحيث لا يكون لحجم المبيعات تأثير غير متناسب مقارنة بتكرار الشراء.
    3. قارن بين إعدادات التجميع المختلفة دون الحاجة إلى إعادة كل اختبار يدويًّا.
    4. اقرأ مجموعات قابلة للتفسير، مع تسميات وأنماط ذات مغزى بالنسبة للمبيعات أو التسويق أو العمليات.
    5. حوّل المجموعات إلى قرارات، مثل الأولويات التجارية أو شرائح الترويج أو سياسات إعادة الطلب.

    لا تكمن الميزة في الأتمتة بحد ذاتها، بل في أن وقت الفريق يُخصص للجزء الأكثر أهمية: تفسير الشجرة التصنيفية، واختيار مستوى التقسيم المناسب، وتحديد ما يجب فعله بهذه المجموعات.

    بالنسبة للشركات الصغيرة والمتوسطة، يُحدث هذا فرقًا كبيرًا. فبدلاً من التساؤل بشكل نظري حول ما إذا كان ينبغي استخدام طريقة «وارد» أو «المتوسط» أو «الشاملة»، يصبح المقارنة أمرًا عمليًا: أي طريقة تنتج مجموعات أكثر وضوحًا لعملائنا ومنتجاتنا وأهدافنا؟ ELECTE هذا السؤال بسهولة حتى في غياب فريق داخلي من علماء البيانات.

    وبالتالي، فإن الأتمتة لا تحل محل التقدير الإداري، بل تضعها في المكان المناسب ضمن العملية.

    الاستنتاجات والنقاط الرئيسية التي يجب تذكرها

    التجميع الهرمي التكتلي ليس مجرد موضوع دراسي جامعي. إنه أداة عملية لتنظيم البيانات التي لولا ذلك لظلت مجزأة.

    النقاط الأساسية التي يجب أخذها في الاعتبار قليلة لكنها حاسمة:

    • تبدأ من القاعدة إلى القمة. تبدأ كل ملاحظة بمفردها، ثم يتم ربطها تدريجيًا بملاحظات أخرى مشابهة.
    • لا يفرض قيمة k في البداية. وهذا يجعل هذه الطريقة مفيدة عندما لا تعرف بعد عدد المقاطع المناسبة.
    • يؤثر اختيار الارتباط على النتيجة. لا تنتج صيغ «Ward» و«complete» و«average» و«single» نفس البنية.
    • يساعد الشجرة التصنيفية في اتخاذ القرار. فهي ليست مجرد عرض بياني، بل أداة لترجمة البنية الإحصائية إلى إجراءات إدارية.

    بالنسبة للشركات الصغيرة والمتوسطة، يكمن القيمة الحقيقية في هذا الأمر. فهم العملاء والمنتجات والأنماط التشغيلية بشكل أفضل دون الاعتماد على الحدس وحده. إذا كان فريقك يتمتع بالمهارات التقنية اللازمة، فيمكنك البدء باستخدام لغة Python ومكتبة scikit-learn. أما إذا كنت ترغب في الوصول إلى رؤى واضحة بشكل أسرع، فإن اتباع نهج آلي يقلل من العقبات ويختصر الوقت.

    ليس المقصود هنا استخدام خوارزمية «متطورة». بل المقصود هو اتخاذ قرارات أكثر وضوحًا، مع مراعاة السياق بشكل أكبر وتقليل التشويش.


    إذا كنت ترغب في تحويل البيانات المتفرقة إلى شرائح واضحة وقرارات عملية، اكتشف كيف ELECTE تجعل التحليل في متناول الجميع حتى بدون فريق من علماء البيانات. يمكنك ربط مصادر البيانات الخاصة بك، والحصول على رؤى واضحة، والانتقال بسرعة أكبر من التحليل إلى العمل.

    موارد لنمو الأعمال التجارية