
إن حد تبريد الهواء لم يعد خطا نظريا في البنية التحتية للذكاء الاصطناعي. عندما يمكن لرف واحد أن يقفز من الكثافة القديمة إلى 40 كيلوواط أو 70 كيلوواط أو حتى حوالي 120 كيلوواط في التكوينات المتقدمة ، يصبح تدفق الهواء وحده مكلفًا وصاخبًا وصعبًا القياس. أنت لا تحارب درجة الحرارة فقط. أنت تحمي انتاج الحوسبة المستدامة وطاقة المروحة ومساحة الأرض في نفس الوقت. ولهذا السبب تحول التبريد السائل من ترقية اختيارية إلى متطلبات تصميم في مراكز بيانات الذكاء الاصطناعي الحديثة.
إذا كنت تشتري أجهزة حرارية لهذا التحول ، فإن شركة واحدة تستحق النظر بجدية هي غرانو. تأسست في عام 2015 ، وتركز على مبادلات الحرارة الصفيحة والأجزاء ذات الصلة وخدمات الصيانة ، مع القدرات التي تغطي التصميم والتصنيع والاختبار وقطع الغيار ودعم ما بعد البيع. بالنسبة لك، وهذا مهم لأن مشروع تبريد الذكاء الاصطناعي نادرا ما يكون مجرد شراء مبادل واحد. تحتاج إلى مورد يمكنه المساعدة في أجهزة جانب الرف المدمجة ووحدات جانب المرفق الأكبر واستراتيجية التنظيف والمواد والتوسع المستقبلي. في هذا المعنى، هذا هو شريك عملي: فإنه يقدم كل من حلول مبادلات الحرارة اللوحية الملحومة والقابلة للفصل، بالإضافة إلى دعم الخدمة، بحيث يمكن أن تنمو حلقة السائل الخاصة بك مع خطة الحوسبة الخاصة بك بدلا من إعادة بناء كل دورة تحديث.
لماذا يصل حد تبريد الهواء بسرعة كبيرة في مراكز بيانات الذكاء الاصطناعي
تغير الذكاء الاصطناعي المشكلة الحرارية بسرعة أسرع من معظم المباني التي يمكن أن تتغير معها. يظهر نمط صناعي مستشهد به على نطاق واسع الرفوف التقليدية للمؤسسات والسحابة بمتوسط حوالي 10 كيلوواط ، في حين دفعت الأنظمة المتسارعة كثافة الرفوف إلى حوالي 25 كيلوواط في عام 2022 ، 40 كيلوواط في عام 2023 ، و 72 كيلوواط في عام 2024. تظهر وثائق البائع العامة لنظام الذكاء الاصطناعي الحالي على نطاق الرف استهلاك طاقة الرف التقريبي عند 120 كيلوواط. في تلك المرحلة ، تواجه الغرفة الميكانيكية ، وتدفق الهواء في الأرضية المرتفعة ، واستراتيجية المروحة في الرف دورة عمل مختلفة جدا عن تلك التي تم بناؤها لها.
أرقام الكثافة التمثيلية في المصادر العامة
| النظام أو المعيار | الكثافة / الطاقة المبلغ عنها |
| متوسط الرف النموذجي للمؤسسة أو السحابة | ~ 10 كيلوواط / رف |
| تصميم رف الذكاء الاصطناعي مع جيل A100 (2022) | ~ 25 كيلوواط / رف |
| تصميم رف الذكاء الاصطناعي مع جيل H100 (2023) | ~ 40 كيلوواط / رف |
| تصميم رف الذكاء الاصطناعي مع جيل GH200 (2024) | ~ 72 كيلوواط / رف |
| نظام GB200 على نطاق الرف | ~ 120 كيلوواط استهلاك الطاقة الرف |
المصدر: تحليل صناعة Schneider Electric ووثائق النظام الرسمية لـ NVIDIA. أرقام تخطيط التصميم لشنايدر هي مراجع تقريبية لكثافة الرف، في حين أن أرقام NVIDIA هي قيمة طاقة الرف الخاصة بالمنتج.
هذا مهم لأن الحرارة لا ترفع درجة الحرارة فقط. كما يقلل من الأداء عندما يصل السيليكون إلى الحدود الحرارية. تقول إنتل إن الخناق يقلل من سرعة الساعة بمجرد تجاوز درجة الحرارة حد المعالج ، وتوثيق NVIDIA أن الخناق الحراري لجهاز المعالجة الرسومية يقلل من تردد الساعة لمنع الاحترار الزائد. وبعبارة أخرى ، فإن التبريد غير الكافي لا يخاطر فقط بالموثوقية ؛ يمكن أن تقلل مباشرة من الحوسبة التي دفعتها.
بمجرد أن تقترب من حد تبريد الهواءإضافة المزيد من تدفق الهواء يتوقف عن كونها إصلاح نظيف. وتلاحظ ASHRAE أن المصممين نظروا مرة واحدة إلى خزانات 20 إلى 30 كيلوواط قريبة من السقف لتبريد الهواء ، وأن المنتجات الجديدة المبردة بالهواء وصلت إلى حوالي 40 إلى 50 كيلوواط فقط من خلال التقدم الرئيسي في تدفق الهواء ، وقوة مروحة أعلى ، وكفاءة تبريد أقل. هذا تحذير لمشغلي الذكاء الاصطناعي: لا يزال الهواء يمكن تمديده ، ولكن تكلفة تمديده ترتفع بسرعة.
لماذا يغير التبريد السائل المعادلة الحرارية
هذا هو المكان الذي يصبح فيه التبريد السائل أكثر من اتجاه. وتقول المنظمة إن المياه لديها أكثر من 3500 مرة قدرة حرارية من الهواء، وهذا هو السبب في أن المياه يمكن أن تحمل حرارة أكثر بكثير من الإلكترونيات الكثيفة مما يمكن للهواء في نفس البيئة. هذه الميزة الفيزيائية الواحدة تغير منطق التصميم بأكمله. تتوقف عن إجبار الغرفة على إزالة كل واط ، وبدلاً من ذلك تحرك حصة كبيرة من الحرارة مباشرة إلى حلقة سائلة بالقرب من المصدر.
في الممارسة العملية ، يعطيك هذا ثلاث مزايا تجارية. أولا، يمكنك الحفاظ على المعالجات أقرب إلى ذروة الأداء المستدامة لأن الحرارة يتم إزالتها في حلقة الشريحة أو الرف بدلا من الاعتماد فقط على هواء الغرفة. ثانيا، يمكنك تقليل الاعتماد على المروحة الداخلية الكبيرة ومعدات معالجة الهواء الكبيرة. ثالثا، يمكنك دعم كثافة رف أعلى دون تحويل المساحة البيضاء إلى متاهة من حلول تدفق الهواء. هذا هو السبب في أن التبريد السائل هو الإجابة الأكثر مباشرة بمجرد أن تبدأ عمليات نشر الذكاء الاصطناعي في كشف حد تبريد الهواء في العمليات الحية.
حيث يناسب مبادل حرارة لوحة لحام على مستوى الرف

بمجرد نقل الحرارة إلى السائل ، يصبح السؤال مدى كفاءة نقل تلك الحرارة بين الحلقات في بصمة ضيقة جداً. على مستوى الرف أو المقترن عن كثب ، محام لوحة مبادل الحرارة هو تناسب قوي لأن المساحة نادرة والاستجابة الحرارية يجب أن تكون سريعة.
تستخدم وحدة لحام لوحات معدنية منضمة إلى نواة واحدة مضغوطة بدلاً من الاعتماد على إطار مغلق قابل للفصل. بالنسبة لك ، يعني ذلك بصمة أصغر ، وأقل واجهات ختم في النواة ، وملائمة قوية لخدمة الضغط العالي ودرجة الحرارة العالية. استنادا إلى بيانات المنتج التي تم تحميلها ، يدعم خط المنتج هذا ضغط العمل الذي يصل إلى 40 ميجا باس ودرجة حرارة التشغيل التي تصل إلى 300 درجة مئوية ، مع الحفاظ على هيكل مدمج وكفاءة نقل الحرارة العالية. هذه سمات مفيدة عندما تتغير أحمال العمل بالذكاء الاصطناعي بسرعة ولا يمكن للحلقة الحرارية تحمل التأخير.
إذا كان تصميمك قد عبر بالفعل حد تبريد الهواء، يصبح هذا النوع من المبدل المدمج أكثر قيمة من طبقة أخرى من التعويض المدفوع بالمروحة. تريد نقل حرارة سريع في أصغر غلاف ميكانيكي ممكن، وخاصة في التخطيطات المجاورة لـ CDU أو المتكاملة مع الانزلاق. وتتعامل أنظمة الرف الحديثة المبردة بالسائل أيضًا مع الكشف عن التسرب بوصفه وظيفة موثوقية أساسية ، مما يظهر مدى جدية تعامل الصناعة الآن مع سلامة حلقة السوائل. لا يزيل النواة الملحومة الحاجة إلى تصميم حلقة جيدة ، لكنها تزيل نقاط الصيانة المتعلقة بالطبقة داخل نواة المبدل نفسها.
حيث يناسب مبادل حرارة لوحة قابلة للفصل على مستوى المنشأة
التبريد في الرف يحل جزءًا فقط من المشكلة. لا تزال تحتاج إلى نقل الحرارة من الحلقة الثانوية إلى حلقة المبنى أو المبرد الجاف أو مسار برج التبريد. هذا هو المكان الذي لوحة مبادل الحرارة يصبح الخيار الأفضل.
على مستوى المرفق، تتغير أولوياتك. لا تزال البصمة الضيقة مهمة، ولكن قابلية الخدمة والتوسع مهمة أكثر. وفقا للمواد التي تم تحميلها ، يدعم خط مبادل الحرارة الصفيحة القابلة للفصل ما يصل إلى 5000 متر مربع من مساحة تبادل الحرارة ، وما يصل إلى ضغط عمل 25 ميجا باس ، ودرجة حرارة التشغيل تصل إلى 200 درجة مئوية. والأهم من ذلك ، يمكن فتح الوحدة للتنظيف ، ويمكن إضافة أو إزالة الألواح مع نمو حمولتك. بالنسبة لمرفق الذكاء الاصطناعي، فإن هذه المرونة عملية. يمكنك البدء بمجموعة واحدة، ثم توسيع قدرة التبريد في وقت لاحق دون استبدال الواجهة الحرارية بأكملها.
ويشكل انجراف حجم المعادن وجودة المياه قضايا حقيقية في المرافق، وخاصة في الحلقات الأكبر. كما تؤكد المواد التقنية التي تم تحميلها على أن الوحدات القابلة للفصل أسهل تفكيكها وفحصها وتنظيفها كيميائياً عندما يقلل التلوث من الأداء الحراري. هذا يعالج مباشرة قلق مشترك للعميل: أنت لا تحتاج فقط إلى كفاءة أولية عالية. تحتاج إلى كفاءة يمكنك التعافي بعد أشهر من التشغيل الحي.
مقارنة المنتج لاختيار حلقة تبريد الذكاء الاصطناعي
| المنتج | أفضل مناسبة في مسار التبريد | الميزة الرئيسية | ماكس ضغط العمل | أقصى درجة حرارة التشغيل | منطقة تبادل الحرارة |
|---|---|---|---|---|---|
| محام لوحة مبادل الحرارة | حلقة جانب الرف ، انزلاق CDU المجاور ، واجهة حرارية عالية الكثافة المدمجة | النواة المدمجة ، نقل الحرارة السريع ، تسامح الضغط القوي | 40 ميجا باس | 300°C | ما يصل إلى 2500 متر مربع |
| لوحة مبادل الحرارة | حلقة ثانوية إلى حلقة المياه المرفق، المبرد، أو واجهة برج التبريد | قابلة للفصل للتنظيف، لوحات وحدات للتوسع | 25 ميجا باس | 200°C | ما يصل إلى 5000 متر مربع |
المصدر: تحميل مواد المنتج.
أخير تناول
بالنسبة للبنية التحتية للذكاء الاصطناعي، فإن حد تبريد الهواء هذا ليس إزعاجا مؤقتا. إنها النقطة التي يتوقف فيها تدفق الهواء عن التوسع الاقتصادي مع كثافة الحساب. التبريد السائل يغير ذلك عن طريق نقل الحرارة بكفاءة أكبر بكثير ، في حين أن مبادلات الحرارة الصفيحة تجعل الهندسة المعمارية السائلة عملية على مستوى الرف ومستوى المرفق. إذا كنت تريد الرفوف الكثيفة ، والأداء المستقر ، والتوسع الأنظف ، ونظام تبريد يمكنك الحفاظ عليه مع مرور الوقت ، والاستراتيجية الفائزة ليست الهواء أكثر. إنه طريق أفضل لنقل الحرارة.
الأسئلة الشائعة
س: ما هو حد تبريد الهواء في مركز بيانات الذكاء الاصطناعي؟
رصد درجات حرارة المدخل يكتشف المشاكل في وقت مبكر في بيئات الذكاء الاصطناعي، فإن حد تبريد الهواء هي النقطة التي لا يمكن فيها التبريد بالهواء فقط إزالة الحرارة بكفاءة كافية دون طاقة المروحة المفرطة أو تعقيد تدفق الهواء أو مخاطر الأداء. وتشير الهيئة إلى أن الخزانات التي كان يعتقد أنها قريبة من سقف تبريد الهواء كانت حوالي 20 إلى 30 كيلوواط، في حين أن منتجات تبريد الهواء الأكثر تقدماً دفعت لاحقاً إلى حوالي 40 إلى 50 كيلوواط، ولكن مع ارتفاع تكلفة التبريد وانخفاض الكفاءة.
س: متى يجب الانتقال من التبريد الهوائي إلى التبريد السائل؟
رصد درجات حرارة المدخل يكتشف المشاكل في وقت مبكر يجب عليك تقييم التبريد السائل بجدية بمجرد اقتراب خطة الرف الخاصة بك حد تبريد الهواءخاصة عندما تتوقع حمولات عمل ثقيلة باستمرار من وحدة الرسم البياني، أو زيادة طاقة المروحة، أو توسيع الكثافة في المستقبل. وقد انتقلت أرقام تخطيط الصناعة بالفعل من حوالي 10 كيلوواط من متوسط الرفوف إلى 40 كيلوواط ، 72 كيلوواط ، وحتى حوالي 120 كيلوواط من الأنظمة على نطاق الرفوف في عمليات نشر الذكاء الاصطناعي المتقدمة.
س: لماذا تستخدم كل من مبادلات الحرارة اللوحية الملحومة والقابلة للفصل في مشروع واحد؟
رصد درجات حرارة المدخل يكتشف المشاكل في وقت مبكر لأنها تحل مشاكل مختلفة. مبادل حرارة لوحة لحام أفضل عندما تحتاج إلى حجم مدمج ونقل حرارة سريع بالقرب من حلقة الرف. مبادل حرارة لوحة قابلة للفصل أفضل عندما تحتاج إلى تبادل حرارة أكبر مساحة ، وتنظيف أسهل ، وخيار إضافة لوحات مع نمو المنشأة. تستخدم معًا ، وتخلق بنية تبريد سائل أكثر مرونة.