نقطه تاریک مدل‌های زبان بزرگ (LLMs): مصرف منابع ارزشمند

مدل‌های زبان بزرگ (LLMs) مدرن مانند ChatGPT و گونه‌های مختلف آن، در حین جستجو برای پاسخ‌ها، صدها میلیارد، اگر نگوییم تریلیون‌ها، پارامتر را پردازش می‌کنند. با مقیاس‌پذیری این مدل‌ها، فشار بر زیرساخت‌های اصلی غیرقابل چشم‌پوشی می‌شود.

ریچ گادومسکی (Rich Gadomski)، مدیر فروش کانال و توسعه کسب‌وکار جدید در FUJIFILM North America Corp.، به TechRepublic گفت: «با ظهور هوش مصنوعی، تقاضاها بر زیرساخت‌های فناوری اطلاعات، از جمله ذخیره‌سازی، توان و خنک‌سازی، به سرعت در حال تشدید است. این تقاضاها فشار زیادی برای کنترل هزینه‌ها، کاهش مصرف انرژی و به حداقل رساندن ردپای کربن ایجاد می‌کنند.»

این امر نگرانی‌های جدی را در مورد مصرف انرژی و آب افزایش داده است. سام آلتمن (Sam Altman)، مدیرعامل OpenAI، اخیراً تلاش کرد تا این ترس‌ها را با گفتن اینکه میانگین یک جستجو 10 برابر کمتر از برآوردهای قبلی انرژی مصرف می‌کند (0.34 وات ساعت و 0.000085 گالن آب) از بین ببرد.

اما با 2.5 میلیارد جستجو در روز، این تقریباً به یک میلیارد وات ساعت می‌رسد، که برای تأمین برق یک میلیون خانه به مدت یک ساعت کافی است. این حجم روزانه همچنین تقریباً یک چهارم میلیون گالن آب مصرف می‌کند. این مقدار زیادی برق و آب است، در زمانی که شرکت‌های آب و برق و کشورها توانایی کمتری برای تأمین آن دارند.

سوال اکنون این است که آیا استراتژی‌های داده‌ای هوشمندانه‌تر می‌توانند از خارج شدن تقاضای منابع هوش مصنوعی از کنترل جلوگیری کنند.

ردیف‌بندی برای کاهش مصرف انرژی

یکی از استراتژی‌های مؤثر برای کاهش مصرف انرژی و آب، ایجاد ردیف‌های داده (Tiering) است.

به عنوان مثال، سازمانی را در نظر بگیرید که در حال راه‌اندازی یک مدل زبانی LLM داخلی است. این مدل‌ها معمولاً بسیار کوچک‌تر از مدل‌هایی مانند ChatGPT هستند. اما می‌توان ساختاری ایجاد کرد که در آن داده‌های خاص همیشه از طریق جستجوها قابل دسترسی باشند، در حالی که داده‌های دیگر ممکن است در یک ردیف داده‌ای پایین‌تر و کمی کندتر قرار گیرند.

شاید تمام داده‌های دو سال گذشته، همراه با سایر داده‌های کلیدی مرتبط با سازمان، بلافاصله در دسترس باشند. هر چیز دیگری به یک ردیف پایین‌تر یا آرشیو منتقل می‌شود. اگر یک جستجوی خاص داده‌هایی را در ردیف پایین‌تر یا آرشیو هدف قرار دهد، پاسخ ممکن است تنها چند دقیقه به تأخیر بیفتد.

گادومسکی، که همچنین یکی از رؤسای Active Archive Alliance است، می‌گوید: «سازمان‌ها باید از پروژه‌های داده‌ای کوتاه‌مدت و واکنشی به سمت معماری‌های داده‌ای استراتژیک و پایدار حرکت کنند.»

او از آرشیو فعال (Active Archiving) به عنوان یک راه‌حل برای مدیریت هوشمند داده‌ها در عصر هوش مصنوعی حمایت می‌کند. آخرین معماری‌های آرشیو در حال تبدیل آن‌ها از مخازن قدیمی و به ندرت مورد دسترسی داده‌های قدیمی به منابعی پویاتر هستند که می‌توانند ارزشی فراتر از انطباق (Compliance) به سازمان اضافه کنند.

آنچه زمانی داده‌های منسوخ یا صرفاً تاریخی در نظر گرفته می‌شد، اگر مدل‌های هوش مصنوعی بتوانند برای کشف بینش‌هایی که قبلاً نادیده گرفته شده بودند، به آن دسترسی پیدا کنند، می‌تواند ارزش بالایی داشته باشد.

آرشیوهای مدرن سریع هستند

به گفته گادومسکی، حداقل 80 درصد از داده‌های دیجیتال را می‌توان به عنوان کم‌فعالیت یا کاملاً غیرفعال طبقه‌بندی کرد.

اگر موتور هوش مصنوعی مجبور باشد برای هر جستجو در تمام این داده‌ها غوطه‌ور شود، به معنای 80 درصد اتلاف توان و آب است. با نگه‌داشتن آن داده‌ها در یک آرشیو فعال تا زمانی که برای یک جستجوی خاص مورد نیاز باشند، می‌توان یک فرورفتگی قابل توجه در مشکل مصرف منابع هوش مصنوعی ایجاد کرد.

برای برخی سازمان‌ها، یک سیستم ردیف‌بندی پیچیده شامل ذخیره‌سازی در حافظه (In-Memory Storage)، SSDها، دیسک، فضای ابری (Cloud)، نوار (Tape) و ذخیره‌سازی نوری (Optical Storage) خواهد بود. با پایین آمدن در سلسله مراتب داده، زمان دسترسی کاهش می‌یابد. اما حتی داده‌های ذخیره شده در سیستم‌های نوار آنلاین و خودکار نیز با جدیدترین نرم‌افزار آرشیو فعال، می‌توانند در عرض چند دقیقه قابل دسترسی باشند.

گادومسکی می‌گوید: «آرشیو فعال محدودیت‌های آرشیوهای فیزیکی سنتی را برطرف می‌کند و زمان دسترسی سریع به سیستم‌های ذخیره‌سازی ثانویه (آرشیو) را فراهم می‌سازد. این یک مزیت برای گردش کار مرتبط با هوش مصنوعی است.»

کاهش صورت‌حساب انرژی و آب هوش مصنوعی

به سازمان‌هایی که مایلند اهداف هوش مصنوعی خود را با برنامه‌های پایداری در حال انجام هماهنگ کنند، توصیه می‌شود که توجه ویژه‌ای به تعداد پارامترهایی که LLMs آن‌ها در هر زمان نیاز به دسترسی دارند و اینکه کدام پارامترها را می‌توان برای مواقعی که آن داده‌ها برای حل جستجو ضروری هستند، نزدیک نگه داشت، داشته باشند.

گادومسکی نتیجه گرفت: «داده‌ها در یک آرشیو فعال همیشه آنلاین و به راحتی قابل دسترسی هستند و امکان بازیابی و تجزیه و تحلیل سریع را در صورت نیاز فراهم می‌کنند، و باعث حفظ ذخیره‌سازی اولیه گران‌قیمت، با کارایی بالا و پرمصرف انرژی می‌شوند.»

در جای دیگر، طرح سه‌گانه جدید Salesforce برای آب در مراکز داده نشان می‌دهد که چگونه هایپراسکیلرها (Hyperscalers)، رشد هوش مصنوعی را به اهداف سخت‌گیرانه‌تر کارایی و حفظ منابع گره می‌زنند. این شرکت‌ها، به عنوان پیشتازان مصرف منابع، مسئولیت دارند تا استانداردهایی را برای پایداری در مقیاس بزرگ تعیین کنند، و این نشان می‌دهد که آینده هوش مصنوعی باید لزوماً یک آینده “سبزتر” باشد.