ایراد بزرگی که ژاپنیها در هوش مصنوعی مشهور پیدا کردند
ژاپن در حال ساخت نسخههای خود از چت جیپیتی (ChatGPT) است. این ربات هوش مصنوعی که توسط شرکت آمریکایی OpenAI ساخته شده است پس از رونمایی در کمتر از یک سال قبل، به طور جهانی مورد توجه قرار گرفت.
دولت ژاپن و شرکتهای بزرگ فناوری مانند NEC، فوجیتسو و سافتبانک صدها میلیون دلار برای ایجاد سیستمهای هوش مصنوعی صرف میکنند که بر اساس همان فناوری زیربنایی معروف به مدلهای زبانی بزرگ کار میکنند، اما به جای ترجمه نسخه انگلیسی از زبان ژاپنی استفاده میکنند.
کیسوکه ساکاگوچی (Keisuke Sakaguchi)، محقق دانشگاه توهوکو در ژاپن که متخصص پردازش زبان طبیعی است، میگوید: مدلهای زبانی بزرگ عمومی فعلی، مانند جیپیتی، در زبان انگلیسی برتری دارند، اما اغلب در زبان ژاپنی به دلیل تفاوت در سیستم الفبا، دادههای محدود و سایر عوامل دچار کاستی هستند.
تعصب زبان انگلیسی
مدلهای زبانی بزرگ به طور معمول از حجم عظیمی از دادهها و منابع در دسترس عموم برای یادگیری الگوهای گفتار و نثر طبیعی استفاده میکنند. آنها آموزش میبینند که کلمه بعدی را بر اساس کلمات قبلی در یک متن پیشبینی کنند. اکثریت قریب به اتفاق متنی که مدل قبلی چت جیپیتی یعنی جیپیتی -۳ (GPT-۳)، براساس آن آموزش داده شده بود، به زبان انگلیسی بود.
توانایی قابل توجه چت جیپیتی در برقراری مکالمات مشابه انسان، هم محققان را خوشحال و هم نگران کرده است. برخی آن را یک ابزار بالقوه برای صرفه جویی در نیروی کار میدانند در حالی که دیگران نگران هستند که از آن برای ساخت مقالات یا دادههای علمی استفاده شود.
در ژاپن، این نگرانی وجود دارد که سیستمهای هوش مصنوعی آموزشدیده بر روی مجموعههای داده به زبانهای دیگر نتوانند پیچیدگیهای زبان و فرهنگ ژاپن را درک کنند. ساختار جملات در زبان ژاپنی کاملا متفاوت از انگلیسی است. بنابراین چت جیپیتی باید یک درخواست ژاپنی را به انگلیسی ترجمه کند، پاسخ را بیابد و سپس پاسخ را به ژاپنی ترجمه کند.
در حالی که زبان انگلیسی تنها ۲۶ حرف دارد، زبان ژاپنی نوشتاری متشکل از دو مجموعه ۴۸ حرفی اصلی، به علاوه ۲۱۳۶ نویسه چینی یا کانجی است که به طور منظم استفاده میشود. اکثر کانجیها دو یا چند تلفظ دارند و ۵۰ هزار کانجی دیگر وجود دارد که به ندرت استفاده میشود. با توجه به این پیچیدگی، جای تعجب نیست که چت جیپیتی نتواند با این زبان دست و پنجه نرم کند.
ساکاگوچی میگوید در زبان ژاپنی، چت جیپیتی گاهی اوقات نویسههای بسیار کمیابی تولید میکند که اکثر مردم هرگز آنها را ندیدهاند و در نتیجه کلمات ناشناخته عجیب و غریب بهوجود میآید.
هنجارهای فرهنگی
برای اینکه یک مدل زبانی بزرگ مفید و حتی از نظر تجاری قابل دوام باشد، باید فرهنگ و همچنین زبان را به طور دقیق منعکس کند. برای مثال، اگر از چت جیپیتی خواسته شود که یک ایمیل درخواست شغل به زبان ژاپنی بنویسد، ممکن است عبارات استاندارد ادبی را حذف کند و نتیجه آن مانند ترجمهای واضح از انگلیسی به نظر برسد.
برای سنجش میزان حساسیت مدلهای زبانی بزرگ نسبت به فرهنگ ژاپنی، گروهی از محققان راکودا (Rakuda) را راه اندازی کردند. راکودا رتبه بندی است که نشان میدهد مدلهای زبانی بزرگ تا چه اندازه میتوانند به سوالات باز در مورد موضوعات ژاپنی پاسخ دهند.
سم پاساگلیا (Sam Passaglia)، بنیانگذار راکودا و همکارانش، از چت جیپیتی خواستند که روان بودن و تناسب فرهنگی پاسخها را با درخواستهای استاندارد مقایسه کند.
پاساگلیا، فیزیکدان دانشگاه توکیو که مدلهای زبان ژاپنی را مطالعه میکند، میگوید: مسلما مدلهای زبانی بزرگ ژاپنی بهبود زیادی مییابند، اما در حال حاضر آنها بسیار عقبتر از جیپیتی -۴ هستند. او میگوید، اصولا دلیلی وجود ندارد که یک مدل زبانی بزرگ ژاپنی نتواند در آینده برابر با جیپیتی-۴ باشد یا از آن پیشی بگیرد. این از نظر فنی قابل حل است، اما مشکل منابع وجود دارد.
یکی از تلاشها برای ایجاد یک مدل زبانی بزرگ ژاپنی استفاده از ابررایانه ژاپنی فوگاکو (Fugaku) است. فوگاکو که یکی از سریعترینهای جهان است عمدتا مدل زبانی را بر اساس ورودی ژاپنی آموزش میدهد.
با حمایت موسسه فناوری توکیو، دانشگاه توهوکو، فوجیتسو و گروه مراکز تحقیقاتی ریکن (RIKEN) با بودجه دولتی، انتظار میرود مدل زبانی حاصل در سال آینده منتشر شود.
این مدل زبانی بزرگ برخلاف جیپیتی-۴ و سایر مدلهای اختصاصی، به سایر مدلهای زبانی منبع باز ملحق میشود تا کد خود را در دسترس همه کاربران قرار دهد. به گفته ساکاگوچی، که در این پروژه مشارکت دارد، محققان امیدوارند دستکم ۳۰ میلیارد پارامتر به آن بدهد که بر خروجی آن تأثیر میگذارد و میتوانند به عنوان معیاری برای اندازه آن عمل کند.
با این حال، مدل زبانی فوگاکو ممکن است توسط یک مدل حتی بزرگتر جانشین شود.
وزارت آموزش، فرهنگ، ورزش، علم و فناوری ژاپن بودجه ایجاد یک برنامه هوش مصنوعی ژاپنی را که مطابق با نیازهای علمی است، تامین میکند که با یادگیری از تحقیقات منتشر شده، فرضیههای علمی ایجاد کند و به شناسایی اهداف برای تحقیقات سرعت بخشد. این مدل میتواند با ۱۰۰ میلیارد پارامتر شروع به کار کند که کمی بیش از نیمی از اندازه جیپیتی-۳ است و به مرور زمان گسترش مییابد.
ماکوتو تایجی (Makoto Taiji)، معاون مرکز تحقیقات دینامیک بیوسیستم ریکن، در مورد این پروژه میگوید: امیدواریم چرخه تحقیقات علمی را به طور چشمگیری سرعت بخشیم و فضای جستجو را گسترش دهیم. توسعه مدل زبانی بزرگ دستکم ۳۰ میلیارد ین (۲۰۴ میلیون دلار آمریکا) هزینه خواهد داشت و انتظار میرود در سال ۲۰۳۱ به صورت عمومی منتشر شود.
گسترش قابلیتها
دیگر شرکتهای ژاپنی در حال تجاری سازی یا برنامهریزی برای تجاریسازی فناوریهای مدلهای زبانی بزرگ خود هستند.
سازنده ابر رایانه NEC در ماه مه استفاده از هوش مصنوعی مولد خود را بر اساس زبان ژاپنی آغاز کرد و ادعا میکند که این مدل زبانی زمان مورد نیاز برای ایجاد گزارشهای داخلی را ۵۰ درصد و کد منبع نرم افزار داخلی را ۸۰ درصد کاهش میدهد. در ماه ژوئیه، این شرکت شروع به ارائه خدمات هوش مصنوعی با قابلیت شخصیسازی به مشتریان کرد.
ماسافومی اویامادا (Masafumi Oyamada)، محقق اصلی در آزمایشگاههای علوم داده NEC، میگوید که میتوان از آن در طیف وسیعی از صنایع مانند صنایع مالی، حملونقل و تدارکات، توزیع و ساخت استفاده کرد. او اضافه میکند که محققان میتوانند آن را برای نوشتن کد، کمک به نوشتن و ویرایش مقالات و بررسی مقالات منتشر شده موجود استفاده کنند.
در همین حال، شرکت مخابراتی ژاپنی سافتبانک (SoftBank)، حدود ۲۰ میلیارد ین روی هوش مصنوعی مولد آموزش داده شده بر روی متون ژاپنی سرمایه گذاری کرده و قصد دارد سال آینده مدل زبانی بزرگ خود را راهاندازی کند. سافت بانک که ۴۰ میلیون مشتری دارد و با مایکروسافت سرمایه گذار شرکت OpenAI نیز شراکت دارد، میگوید که قصد دارد به شرکتها کمک کند تا کسب و کار خود را دیجیتالی کنند و بهرهوری خود را افزایش دهند. سافت بانک انتظار دارد که مدل زبانی بزرگ آنها توسط دانشگاهها، موسسات تحقیقاتی و سایر سازمانها مورد استفاده قرار گیرد.
در همین حال، محققان ژاپنی امیدوارند که یک چتبات هوش مصنوعی دقیق، موثر و ساخت ژاپن بتواند به سرعت بخشیدن به علم و پر کردن شکاف بین ژاپن و سایر نقاط جهان کمک کند.
۵۸۵۸