آپدیت جدید پروژه ی ترجمهی خودکار با هوش مصنوعی Gemini
مورد 1. مسئله ی تبدیل فایل ass به srt تبدیل به یه کابوس برنامه نویسی شده بود برام...گیت هاب رو زیر رو کردم..چندتا کد js اوردم و روی پروژه تست کردم...کار میکرد ولی بازم از یه جا لنگ ـش میزد بیرون
تا اینکه تصمیم گرفتم که کلاً رویکرد ـم اشتباهه...باید به مسئله از یه نگاه دیگه وارد بشم.
تا الان من فقط قصد ـم این بود که صورت هوشمند متن رو از استایل ها جدا کنه....که این کار سخت و پیاده سازی اون با js کار رو سخت تر میکنه...
برای همین تصمیم گرفتم سیستم میکانیکی درست کنم...نشستم چندین زیرنویس مختلف رو دانلود کردم...و اونها رو با هم مقایسه کردم...به یه الگوریتم خیلی سادهی 4 مرحله ای رسیدم که مثل بنز این تبدیل رو انجام میده.
خلاصه الان سیستم تبدیل ass به srt با دقت 99درصد کار میکنه...
مورد 2. مورد دوم یکی از مسخره ترین موارد برنامه بودش...یعنی مشکل از برنامه نیست، مشکل از مدل هوش مصنوعی بودش
ساده بخوام توضیح بدم، با این وجود که تو پراپمت دستورات صریح و قوانین سفت و سخت گذاشته بودم که ترجمه باید کامل باشه و نباید زمانبندی رو دستکاری کنی
ولی بعضی اوقات ساختار خطوط رو خراب میکرد...یه خط دیالوگ زیرنویس از اول انیمه تا آخر انیمه رو تصویر بودش...چون عاقا (AI) تایمفریم پایانی یه خط رو عوض کرده )":
همین یه تیکه خراب کاری AI باعث میشد که اعصاب ببینده داغون بشه موقعه دیدن انیمه...(البته همیشه اینطوری نمیکنه و کاملاً تصادفی هستش)
برای همین گفتم دیگه نباید مستقیم از خروجی AI برای ساخت فایل srt استفاده کرد....یه تکنیک زدم.....توی برنامه یه حلقه زدم رو زیرنویس انگلیسی که دنبال ترجمه ها تو فایل خروجی AI باشه.
مثل یه پازل ترجمه ها رو کپی کنه بزاره اونطرف...اینطوری اگه از طرف AI خطی رو خراب کرده باشه...هرگز تو نتیجه ی نهایی نمیاد و ما انگلیسی اون رو داریم....
این همه رو توضیح دادم که خواستم بگم اگه دید خطی ترجمه نشده و انگلیسی بود، بدونید اینجا هوش مصنوعی خراب کاری کرده...(مثال پایین)
View attachment 387331
مورد 3. توی استریم کردن دریافت ترجمه، من خوب بافر سازی رو پیاده سازی نکرده بودم...و بخاطر مشکلات اینترنت، بعضی از خط ها کامل دریافت نمیشد(مثال زیر)
Code:{10675}{10704}پیام جدید دریافت شد {10710}{10758}ولی بازم، یه جورایی باحال به نظر میاد. {10769}{10800}مارینا-چان. {10 {10871}{10908}این گجت شاد منه— {10908}{10936}خفه شو. {10960}{10989}سنجاق گل.
همون خط خالی وسط باعث میشد حداقل 1 دقیقه زیرنویس کلاً از بالانس خارج بشه و موقعه تماشا تجربه ی بدی بوجود بیاد....الان دیگه با بهینه کردن بافر استریم این مشکل کامل رفع شده و خروجی اوکی هستش.
مورد 4. حذف خطوط خالی و مرتب سازی اون از نظر زمانبندی تا خوراک API تمیز باشه و بهونه ای برای خراب کردن خروجی نداشته باشه.
---------------------------
خب تقریباً میشه گفت الان به نسخه ی ایدهآل و کاملی که میخواستم رسیده...همهی باگ هایی که طی این چند روز دیدم رو رفع کردم و الان میشه راحت ازش استفاده کرد
لینک برنامه
ترجمه خودکار زیرنویس انیمه با Gemini
P.S
تشکر از همراهی دوستان...حتی ممنون از اینکه هیچ نظری ندادید![]()
دلیل این که چیزی نمیگیم
واسه اینه که نمیدونیم چی بگیم
ابعاد پروژه فراتر از درک ماست



