Skip to main content

اکنون می‌توانید به اسناد خود در گوگل داکس گوش دهید

اولین افزونه در بخش تولید صوت، قابلیتی است به نام «گوش دادن به این تب» (Listen to this tab) که دقیقا همان کاری را انجام می‌دهد که از نامش پیداست. گوگل داکس با استفاده از قدرت پردازشی جمنای، می‌تواند نسخه‌های صوتی بسیار واضح، طبیعی و شبیه به صدای انسان از محتوای سند شما تولید کند. نتیجه کار به قدری روان و دلنشین است که شخصا متوجه شدم گوش دادن به آن برای مدت‌های طولانی، اصلا خسته‌کننده نیست و برخلاف ربات‌های متن‌خوان قدیمی، حس رباتیک و بی‌روحی به کاربر منتقل نمی‌کند.

چگونه از این قابلیت استفاده کنیم؟ بسته به اینکه چگونه از گوگل داکس استفاده می‌کنید، دو راه اصلی برای بهره‌مندی از این ویژگی وجود دارد:

روش اول (برای مصرف‌کنندگان محتوا): اگر شما از آن دسته افرادی هستید که به کتاب‌های صوتی علاقه دارید و ترجیح می‌دهید به جای زل زدن به مانیتور، به متن گوش دهید (یا مثل من دوست دارید همزمان با خواندن متن، صدای آن را هم بشنوید تا تمرکزتان بالا برود)، کافیست از منوی بالای صفحه مسیر زیر را دنبال کنید: Tools -> Audio -> Listen to this tab به محض کلیک، پخش صوت فورا آغاز می‌شود.

وقتی صدا در حال پخش است، یک پخش‌کننده شناور (Floating Player) روی صفحه ظاهر می‌شود که می‌توانید آن را به هر کجای مانیتور که راحت‌ترید جابجا کنید. شما همیشه کنترل کاملی بر تجربه شنیداری خود خواهید داشت. می‌توانید سرعت پخش را تنظیم کنید و حتی صدا و لحن گوینده را تغییر دهید. گوگل چندین پروفایل صوتی متمایز مانند «آموزشگر» (Educator)، «معلم» (Teacher) و «انگیزه‌بخش» (Motivator) را در اختیار شما قرار داده است که هر کدام لحن و انرژی خاص خود را دارند. با کلیک روی گزینه 1x (که سرعت پیش‌فرض است) یا منوی سه‌نقطه، می‌توانید این تنظیمات را تغییر دهید.

روش دوم (برای نویسندگان و تولیدکنندگان محتوا): اگر شما نویسنده یک گزارش، مقاله یا دستورالعمل هستید و می‌خواهید این تجربه شنیداری را با همکاران یا خوانندگان خود به اشتراک بگذارید، می‌توانید یک «دکمه صوتی قابل پخش» را مستقیما در داخل متن سند جاسازی (Embed) کنید. برای این کار به مسیر زیر بروید: Insert -> Audio buttons -> Listen to tab پس از درج دکمه، می‌توانید نشانگر موس را روی آن ببرید و با کلیک روی آیکون مداد (ویرایش)، برچسب (Label)، رنگ و اندازه دکمه را تغییر دهید تا با استایل و گرافیک سند شما هماهنگ شود. این کار به ظاهر سند شما جلوه‌ای بسیار حرفه‌ای و مدرن می‌بخشد.

محدودیت‌هایی که باید بدانید: البته این ویژگی هنوز در ابتدای راه است و چند محدودیت دارد. اول اینکه اگر سند شما بیش از 20000 کاراکتر داشته باشد، پخش صدا متوقف می‌شود. این یعنی برای فایل‌های بسیار طولانی (مثل یک کتابچه راهنما)، باید آن‌ها را به بخش‌های کوچک‌تر یا تب‌های مجزا تقسیم کنید. دوم اینکه، در حال حاضر این ویژگی به مرورگرهای دسکتاپ و فقط زبان انگلیسی محدود است. بنابراین اگر ترجیح می‌دهید از اپلیکیشن موبایل گوگل داکس استفاده کنید یا اسناد شما به زبان فارسی هستند، باید منتظر آپدیت‌های آینده گوگل بمانید.

(وضعیت دسترسی: این قابلیت به صورت رسمی برای مشتریان Google Workspace در طرح‌های Business Standard/Plus و Enterprise و همچنین دارندگان افزونه‌های Gemini فعال است. اما اگر در برنامه تست زودهنگام گوگل یعنی Workspace Labs ثبت‌نام کرده باشید، احتمالا فارغ از نوع اشتراکتان، همین الان به آن دسترسی دارید).

خلاصه‌های صوتی هوش مصنوعی؛ اسناد را با گوش‌هایتان اسکن کنید!

ویژگی دوم که حتی از حالت روخوانی هم جدیدتر و به مراتب درخشان‌تر است، «گوش دادن به خلاصه سند» (Listen to document summary) نام دارد. در حالی که ویژگی قبلی، متن شما را کلمه به کلمه می‌خواند، این قابلیت جدید از جمنای می‌خواهد که محتوا را پردازش، تجزیه و تحلیل کرده و یک مرور کلی و شفاهی از آن ارائه دهد. به جای اینکه بیست دقیقه وقت صرف خواندن یک گزارش خسته‌کننده کنید، می‌توانید به یک خلاصه صوتی گوش دهید که معمولا فقط چند دقیقه طول می‌کشد. این تجربه دقیقا شبیه به این است که یک همکار بسیار آماده و مطلع، قبل از شروع یک جلسه مهم، چکیده گزارش را برای شما به صورت شفاهی توضیح دهد.

قابلیت ادغام تب‌ها (یک ویژگی انقلابی): یکی از نقاط قوت این ویژگی این است که می‌تواند اطلاعات را از چندین تب (Tab) مختلف در یک سندِ واحد بیرون بکشد تا دیدگاهی جامع‌نگر از آنچه نوشته‌اید به شما بدهد. اگر یک گزارش مالی یا پروژه را در چندین بخش و تب جداگانه ساختاردهی کرده باشید، هوش مصنوعی فقط تب اول را نمی‌خواند؛ بلکه تمام آن‌ها را با هم ترکیب و سنتز می‌کند. در نتیجه، می‌توانید به راحتی یادداشت‌های جلسه‌ای را که وقت نکرده‌اید بخوانید مرور کنید، نکات کلیدی یک سند طولانی خط‌ مشی سازمانی را استخراج کنید، یا قبل از پریدن به وسط یک فایل پروژه گروهی، به سرعت در جریان امور قرار بگیرید.

دسترسی و زمان‌بندی انتشار: برای دسترسی به این قابلیت، باید به مسیر Tools -> Audio -> Listen to document summary بروید. درست مانند ویژگی روخوانی، خلاصه‌ها نیز از همان فرمت پخش‌کننده صوتی، پروفایل‌های صدا و کنترل سرعت پشتیبانی می‌کنند تا تجربه کاربری یکدستی داشته باشید. نیازی به گفتن نیست که جمنای برای ساخت خلاصه، به محتوای واقعی نیاز دارد؛ بنابراین این گزینه روی اسناد خالی یا اسنادی که فقط چند کلمه در آن‌ها نوشته شده، کار نخواهد کرد.

روند انتشار این ویژگیِ خلاصه‌ساز، همین چند روز پیش یعنی از 12 فوریه 2026 آغاز شده است، بنابراین اگر جزو کاربران واجد شرایط باشید، تا اواخر فوریه باید آن را در سیستم خود دریافت کرده باشید. این ویژگی برای مشترکین رده‌های تجاری و سازمانی، و همچنین کاربران Google AI Pro و Ultra در دسترس است. هیچ دکمه‌ای برای فعال‌سازی دستی آن در تنظیمات وجود ندارد؛ شما یا در حال حاضر به آن دسترسی دارید، یا به زودی دریافتش می‌کنید. (این قابلیت نیز فعلا محدود به دسکتاپ و زبان انگلیسی است).

هشدار جدی: مراقب «توهمات هوش مصنوعی» باشید!

هنگام استفاده از قابلیت خلاصه‌ساز، باید یک نکته بسیار حیاتی را در نظر بگیرید: خطر واقعی «توهمات هوش مصنوعی» (AI Hallucinations). وقتی از ویژگی «گوش دادن به این تب» استفاده می‌کنید، هوش مصنوعی صرفا متن را روخوانی می‌کند و خطایی رخ نمی‌دهد. اما در ویژگی خلاصه‌ساز، جمنای در حال خواندن کلمه به کلمه نیست؛ بلکه فعالانه در حال ترکیب، فشرده‌سازی و استنتاج محتوای شماست. در این فرآیند، ممکن است هوش مصنوعی چیزهایی بگوید که کاملا دقیق نیستند یا مفاهیم را به اشتباه تفسیر کند.

این موضوع با تجربه ما از بهترین چت‌بات‌ها یا ابزارهای تولید محتوا نیز تفاوتی ندارد و ذاتِ فعلی هوش مصنوعی مولد است. به همین دلیل، از این خلاصه‌های صوتی باید به عنوان نقطه شروعی برای درک کلی یک سند استفاده کنید، نه به عنوان یک منبع قطعی و بی‌نقص از محتوای آن. اگر در خلاصه به عدد یا تصمیم مهمی اشاره شد، حتما آن را در متن اصلی چک کنید.

آدرس ایمیل شما نمایش داده نخواهد شد.