
مدلهای زبان بزرگ (LLMs) مدرن مانند ChatGPT و گونههای مختلف آن، در حین جستجو برای پاسخها، صدها میلیارد، اگر نگوییم تریلیونها، پارامتر را پردازش میکنند. با مقیاسپذیری این مدلها، فشار بر زیرساختهای اصلی غیرقابل چشمپوشی میشود.
ریچ گادومسکی (Rich Gadomski)، مدیر فروش کانال و توسعه کسبوکار جدید در FUJIFILM North America Corp.، به TechRepublic گفت: «با ظهور هوش مصنوعی، تقاضاها بر زیرساختهای فناوری اطلاعات، از جمله ذخیرهسازی، توان و خنکسازی، به سرعت در حال تشدید است. این تقاضاها فشار زیادی برای کنترل هزینهها، کاهش مصرف انرژی و به حداقل رساندن ردپای کربن ایجاد میکنند.»
این امر نگرانیهای جدی را در مورد مصرف انرژی و آب افزایش داده است. سام آلتمن (Sam Altman)، مدیرعامل OpenAI، اخیراً تلاش کرد تا این ترسها را با گفتن اینکه میانگین یک جستجو 10 برابر کمتر از برآوردهای قبلی انرژی مصرف میکند (0.34 وات ساعت و 0.000085 گالن آب) از بین ببرد.
اما با 2.5 میلیارد جستجو در روز، این تقریباً به یک میلیارد وات ساعت میرسد، که برای تأمین برق یک میلیون خانه به مدت یک ساعت کافی است. این حجم روزانه همچنین تقریباً یک چهارم میلیون گالن آب مصرف میکند. این مقدار زیادی برق و آب است، در زمانی که شرکتهای آب و برق و کشورها توانایی کمتری برای تأمین آن دارند.
سوال اکنون این است که آیا استراتژیهای دادهای هوشمندانهتر میتوانند از خارج شدن تقاضای منابع هوش مصنوعی از کنترل جلوگیری کنند.

ردیفبندی برای کاهش مصرف انرژی
یکی از استراتژیهای مؤثر برای کاهش مصرف انرژی و آب، ایجاد ردیفهای داده (Tiering) است.
به عنوان مثال، سازمانی را در نظر بگیرید که در حال راهاندازی یک مدل زبانی LLM داخلی است. این مدلها معمولاً بسیار کوچکتر از مدلهایی مانند ChatGPT هستند. اما میتوان ساختاری ایجاد کرد که در آن دادههای خاص همیشه از طریق جستجوها قابل دسترسی باشند، در حالی که دادههای دیگر ممکن است در یک ردیف دادهای پایینتر و کمی کندتر قرار گیرند.
شاید تمام دادههای دو سال گذشته، همراه با سایر دادههای کلیدی مرتبط با سازمان، بلافاصله در دسترس باشند. هر چیز دیگری به یک ردیف پایینتر یا آرشیو منتقل میشود. اگر یک جستجوی خاص دادههایی را در ردیف پایینتر یا آرشیو هدف قرار دهد، پاسخ ممکن است تنها چند دقیقه به تأخیر بیفتد.
گادومسکی، که همچنین یکی از رؤسای Active Archive Alliance است، میگوید: «سازمانها باید از پروژههای دادهای کوتاهمدت و واکنشی به سمت معماریهای دادهای استراتژیک و پایدار حرکت کنند.»

او از آرشیو فعال (Active Archiving) به عنوان یک راهحل برای مدیریت هوشمند دادهها در عصر هوش مصنوعی حمایت میکند. آخرین معماریهای آرشیو در حال تبدیل آنها از مخازن قدیمی و به ندرت مورد دسترسی دادههای قدیمی به منابعی پویاتر هستند که میتوانند ارزشی فراتر از انطباق (Compliance) به سازمان اضافه کنند.
آنچه زمانی دادههای منسوخ یا صرفاً تاریخی در نظر گرفته میشد، اگر مدلهای هوش مصنوعی بتوانند برای کشف بینشهایی که قبلاً نادیده گرفته شده بودند، به آن دسترسی پیدا کنند، میتواند ارزش بالایی داشته باشد.
آرشیوهای مدرن سریع هستند
به گفته گادومسکی، حداقل 80 درصد از دادههای دیجیتال را میتوان به عنوان کمفعالیت یا کاملاً غیرفعال طبقهبندی کرد.
اگر موتور هوش مصنوعی مجبور باشد برای هر جستجو در تمام این دادهها غوطهور شود، به معنای 80 درصد اتلاف توان و آب است. با نگهداشتن آن دادهها در یک آرشیو فعال تا زمانی که برای یک جستجوی خاص مورد نیاز باشند، میتوان یک فرورفتگی قابل توجه در مشکل مصرف منابع هوش مصنوعی ایجاد کرد.

برای برخی سازمانها، یک سیستم ردیفبندی پیچیده شامل ذخیرهسازی در حافظه (In-Memory Storage)، SSDها، دیسک، فضای ابری (Cloud)، نوار (Tape) و ذخیرهسازی نوری (Optical Storage) خواهد بود. با پایین آمدن در سلسله مراتب داده، زمان دسترسی کاهش مییابد. اما حتی دادههای ذخیره شده در سیستمهای نوار آنلاین و خودکار نیز با جدیدترین نرمافزار آرشیو فعال، میتوانند در عرض چند دقیقه قابل دسترسی باشند.
گادومسکی میگوید: «آرشیو فعال محدودیتهای آرشیوهای فیزیکی سنتی را برطرف میکند و زمان دسترسی سریع به سیستمهای ذخیرهسازی ثانویه (آرشیو) را فراهم میسازد. این یک مزیت برای گردش کار مرتبط با هوش مصنوعی است.»
کاهش صورتحساب انرژی و آب هوش مصنوعی
به سازمانهایی که مایلند اهداف هوش مصنوعی خود را با برنامههای پایداری در حال انجام هماهنگ کنند، توصیه میشود که توجه ویژهای به تعداد پارامترهایی که LLMs آنها در هر زمان نیاز به دسترسی دارند و اینکه کدام پارامترها را میتوان برای مواقعی که آن دادهها برای حل جستجو ضروری هستند، نزدیک نگه داشت، داشته باشند.

گادومسکی نتیجه گرفت: «دادهها در یک آرشیو فعال همیشه آنلاین و به راحتی قابل دسترسی هستند و امکان بازیابی و تجزیه و تحلیل سریع را در صورت نیاز فراهم میکنند، و باعث حفظ ذخیرهسازی اولیه گرانقیمت، با کارایی بالا و پرمصرف انرژی میشوند.»
در جای دیگر، طرح سهگانه جدید Salesforce برای آب در مراکز داده نشان میدهد که چگونه هایپراسکیلرها (Hyperscalers)، رشد هوش مصنوعی را به اهداف سختگیرانهتر کارایی و حفظ منابع گره میزنند. این شرکتها، به عنوان پیشتازان مصرف منابع، مسئولیت دارند تا استانداردهایی را برای پایداری در مقیاس بزرگ تعیین کنند، و این نشان میدهد که آینده هوش مصنوعی باید لزوماً یک آینده “سبزتر” باشد.