Anime & Animation Center (قوانین پست اول خوانده شود)

یه قابلیت اساسی و مهم تو برنامه اضافه کردم...که ویراستار راحتر کار کنه و تاثیر مثبتی تو کیفیت خروجی کار داره

View attachment 383929

الان هر نوشته ای دیگه مثل قبل نمیچسبه به تصویر اصلی...بلکه یک لایه درست میشه برای هر ابجکت که به صورت مجزا میشه اون رو کنترل کرد...(یه چیزی مثل فتوشاپ)

P.S
پوست ام کنده شد تا باگ گیری شد....اینقدر سخت و مسخره بودش....که تا درآپ کردن کل پروژه و shift+delete اون تو ذهنم پیش رفتم... :)
سلطون پابلیک کن رپو رو کسی علاقه داشت بتونه کمک کنه :D
 
یه قابلیت اساسی و مهم تو برنامه اضافه کردم...که ویراستار راحتر کار کنه و تاثیر مثبتی تو کیفیت خروجی کار داره

View attachment 383929

الان هر نوشته ای دیگه مثل قبل نمیچسبه به تصویر اصلی...بلکه یک لایه درست میشه برای هر ابجکت که به صورت مجزا میشه اون رو کنترل کرد...(یه چیزی مثل فتوشاپ)

P.S
پوست ام کنده شد تا باگ گیری شد....اینقدر سخت و مسخره بودش....که تا درآپ کردن کل پروژه و shift+delete اون تو ذهنم پیش رفتم... :)


خب یک گام بسیار مثبت برداشتم....اگه یادتون باشه درباره ی محدودیت های خانواده .net نسبت به پایتون گفتم

.تا الان نتونستم کتابخانه خوبی برای پاک کردن نوشته هایی که روی تصاویر هست پیدا کنم که بدرد بخوره باشه و خوب هاش روی پایتون هستند و من برنامه رو با خانواده .net نوشتم...و فعلاً مجبورم از حالت محو پس زمینه استفاده کنم.

و یه روش برای ماسک کردن توضیح دادم


که نتیجه کار با Emgu.CV اینطوری میشد

1.png

2.png

برای جاهای کوچیک و یا با پس زمینه یکنواخت خوب بودش و نوشته وقتی روش قرار میگرفت...خیلی معلوم نبود که زیرش چه خبره...
ولی جاهایی که نوشته زیاد میشد و یا بافت تصویر زیر نوشته پر جزئیات میشد...خروجی اصلاً حرفه ای و رضایت بخش نبودش...



پروژه ی پیشرفت امروز برنامه....این بودش که این سیستم رو کنار بزنم...و واقعاً کوچ کنم روی پایتون....چون بهترین مدل های زبانی برای پایتون طراحی شدن.
مقداری تحیق کردم sample ترین مدل برای پردازش های تصویری که حجم گیگابایتی نداشته باشه...مدل LaMa هستش
اون بخشی از مدل که ما بهش نیاز داریم...simple-lama-inpainting کلاً 200MB بیشتر نیست...و از بابت دشواری حجم های چند گیگی تو برنامه خلاص شدم.

یه برنامه با پایتون نوشتم و کل پروژه رو کامپایل کردم که تبدیل به یک فایل واحد exe اجرای بشه...تا دیگه کاربر درده سر نصب پایتون و یا کتابخانه هاش رو از طریق cmd به صورت دستوری نداشته باشه.

برنامه ـم رو آپدیت کردم که بتونه از این برنامه پایتون جدید استفاده کنه و روش جدید رو به صورت موازی هندل کنه....و حالا نتیجه ـی دلپذیر اون :x


View attachment Record 2025 06 09 22 40 56 910.mp4


البته نیازی نیست با این دقتی که من توی فیلم ماسک کردم...ماسک بشه....میشه قلم رو بزرگ کرد و یه خط کشید رو کل نوشته...مدل خودش میتونه تشخیص بده....


1.png

2.png

3.png


P.S
مدل از نوع CPU محور هستش و نیاز به GPU نداره....هر چی CPU قوی تر باشه...سرعت پردازش بالا میره.

P.SS
تاپیک...Off-topic شد رفت :D

سلطون پابلیک کن رپو رو کسی علاقه داشت بتونه کمک کنه :D

قطعاً که توی گیت هاب میذارمش....ولی تاریخ ـش معلوم نیس
ولی چالش ـش رو دوست دارم...و دلم نمیاد با کسی تقسیم ـش کنم :D
 
آخرین ویرایش:
خب یک گام بسیار مثبت برداشتم....اگه یادتون باشه درباره ی محدودیت های خانواده .net نسبت به پایتون گفتم



و یه روش برای ماسک کردن توضیح دادم


که نتیجه کار با Emgu.CV اینطوری میشد

View attachment 384266

View attachment 384267

برای جاهای کوچیک و یا با پس زمینه یکنواخت خوب بودش و نوشته وقتی روش قرار میگرفت...خیلی معلوم نبود که زیرش چه خبره...
ولی جاهایی که نوشته زیاد میشد و یا بافت تصویر زیر نوشته پر جزئیات میشد...خروجی اصلاً حرفه ای و رضایت بخش نبودش...



پروژه ی پیشرفت امروز برنامه....این بودش که این سیستم رو کنار بزنم...و واقعاً کوچ کنم روی پایتون....چون بهترین مدل های زبانی برای پایتون طراحی شدن.
مقداری تحیق کردم sample ترین مدل برای پردازش های تصویری که حجم گیگابایتی نداشته باشه...مدل LaMa هستش
اون بخشی از مدل که ما بهش نیاز داریم...simple-lama-inpainting کلاً 200MB بیشتر نیست...و از بابت دشواری حجم های چند گیگی تو برنامه خلاص شدم.

یه برنامه با پایتون نوشتم و کل پروژه رو کامپایل کردم که تبدیل به یک فایل واحد exe اجرای بشه...تا دیگه کاربر درده سر نصب پایتون و یا کتابخانه هاش رو از طریق cmd به صورت دستوری نداشته باشه.

برنامه ـم رو آپدیت کردم که بتونه از این برنامه پایتون جدید استفاده کنه و روش جدید رو به صورت موازی هندل کنه....و حالا نتیجه ـی دلپذیر اون :x


View attachment 384265


البته نیازی نیست با این دقتی که من توی فیلم ماسک کردم...ماسک بشه....میشه قلم رو بزرگ کرد و یه خط کشید رو کل نوشته...مدل خودش میتونه تشخیص بده....


View attachment 384278

View attachment 384279

View attachment 384280


P.S
مدل از نوع CPU محور هستش و نیاز به GPU نداره....هر چی CPU قوی تر باشه...سرعت پردازش بالا میره.

P.SS
تاپیک...Off-topic شد رفت :D



قطعاً که توی گیت هاب میذارمش....ولی تاریخ ـش معلوم نیس
ولی چالش ـش رو دوست دارم...و دلم نمیاد با کسی تقسیم ـش کنم :D
احساس کردم لایک به هیچ وجه حق مطلب رو ادا نمیکنه ، واقعا دست خوش !
لذت بردم از سرعت پیشرفت پروژه
موفق باشی آقا خلیل
 
چالش دوم که بسیار پیچیده هستش....میخوام که خودکار کل صفحه رو اسکن کنه بالون ها رو پیدا کرده مختصات رو بگیره...نوشته ها رو پاک کنه، متن رو بفرسته برای OCR و ترجمه ها رو در مختصات صحیح خودشون قرار بده....که این همون محدودیت API هستش که بالا بهش اشاره کردم...که باید توی پرامت بهش آموزش داد که بخشی از کار رو هندل کنه.

چالش دوم رو خاطرتون هست.....اینم فیلمش :)

View attachment Record 2025 06 10 23 44 15 34.mp4


اول خواستم Gemini Flash 2.0 رو آموزش بدم...دیدم فایده نداره و تا وقتی بحث temperature و topP و تا حدی topK تو مدل Gemini وسط میاد...آموزش دادن اون طرف user بنظرم کار سختی و باید با ازمون و خطاهای زیادی سر و کله زد....برای همین بیخالش شدم...

حالا که تونستم....بین برنامه ترجمه و مدل های پایتون لینک بزنم....الان دیگه به دریایی از مدل ها وصل شدم...تحقیق کردم برای چالش دوم...یکی از مدل های خوب YOLO هستش...یه برنامه نوشتم براش و لینکش کردم به برنامه
نتیجه ی کار خوبه...ولی بازم باید روش کار کنم...تا خوب با برنامه مچ بشه....و چندتا آپدیت هم تو برنامه نیاز هست....فعلاً کارش تموم نشده...ولی اصل داستان چالش دوم رو تموم کردم (فیلم)

P.S
خب تقریباً الان اون Roadmap ای که چیده بودم داره به پایان میرسه...و به جزئیات ریز کار رسیدم.
P.SS
شاید وقت و حوصله کردم...کل گرافیک پروژه رو بردم روی Guna.UI که اگه این کار رو کنم، ظاهر برنامه به طرز چشمگیری قشنگ تر میشه....کلاً یکی از UI های مدرن هستش و کار کردن باهاش رو خیلی دوست دارم.
P.SS
هنوز پرامت ترجمه رو آپدیت نکردم و از هنوزم از نسخه ی قدیمی استفاده میکنم..در آینده یه بخشی قرار میدم تو برنامه که بشه اسم مانگا رو هم مشخص کرد...که هوش مصنوعی با توجه به موضوع مانگا، ترجمه بهتری رو بده...

احساس کردم لایک به هیچ وجه حق مطلب رو ادا نمیکنه ، واقعا دست خوش !
لذت بردم از سرعت پیشرفت پروژه
موفق باشی آقا خلیل
ممنون لطف دارید...

با این وجود که تا همین الان هیچ وقت یک صفحه مانگا رو هم ترجمه نکردم :) ولی همیشه این خلاء رو تو زمینه ترجمه مانگا حس میکردم که چرا یه برنامه بومی سازی شده نداریم که بشه راحتر کار کرد.
وقتی فیلم های آموزشی ویراستاری مانگا رو توی Youtube میدیم....میگفتم خدایش کارشون سخته....

یکی باید متن انگلیسی رو از روی مانگا تایپ کنه تو word
یکی باید اون رو ترجمه کنه
یکی باید مانگا رو Clean کنه
یکی دیگه باید ترجمه ها رو بزاره تو جاهای درستش تو بالون ها

البته امروزه خیلی از این مراحل رو با هوش مصنوعی هم میشه انجام داد، ولی بازم دمشون گرم.
 
آخرین ویرایش:
@Eazy-E بی‌مروت یک ندا می‌دادی محتوای این اپیزود Maplestar چیه!:دی
من اینو همون روز که لینک تلگرام دادی دانلود کردم همینطور مونده بود تا امروز؛ شانس آوردم این مدت گوشیم رو دست کسی ندادم.:|

انیمه ندیدم جدیدا چیزی. همچنان فول‌متال می‌خونم و عالیه؛ مانگا چندین لول از انیمه بهتره. لازمه تاکید کنم چه کار بیهوده و وقت‌گیریه آنگوئینگ خوندن/دیدن انیمه اینا.


یعنی چی یعنی نمیدونستی میپل استار چی میسازه یا با محتوای اپیزود دن دن دن مشکل داشتی؟ :D
در هر هر صورت باور میکنی من خودم قبل اینکه اون اپیزود رو ببینم اینجا اعلام ریلیز کردم؟ :D
من اصلا اسمشون رو هم نشنیده بودم آقا.:دی
نخیر، باور نمی‌کنم. شما قطعا یه تیزری دیده بودی.:))
 
آخرین ویرایش:
@Eazy-E بی‌مروت یک ندا می‌دادی محتوای این اپیزود Maplestar چیه!:دی
من اینو همون روز که لینک تلگرام دادی دانلود کردم همینطور مونده بود تا امروز؛ شانس آوردم این مدت گوشیم رو دست کسی ندادم.:|
یعنی چی یعنی نمیدونستی میپل استار چی میسازه یا با محتوای اپیزود دن دن دن مشکل داشتی؟ :D
در هر هر صورت باور میکنی من خودم قبل اینکه اون اپیزود رو ببینم اینجا اعلام ریلیز کردم؟ :D
 
چالش دوم رو خاطرتون هست.....اینم فیلمش :)

View attachment 384411


اول خواستم Gemini Flash 2.0 رو آموزش بدم...دیدم فایده نداره و تا وقتی بحث temperature و topP و تا حدی topK تو مدل Gemini وسط میاد...آموزش دادن اون طرف user بنظرم کار سختی و باید با ازمون و خطاهای زیادی سر و کله زد....برای همین بیخالش شدم...

حالا که تونستم....بین برنامه ترجمه و مدل های پایتون لینک بزنم....الان دیگه به دریایی از مدل ها وصل شدم...تحقیق کردم برای چالش دوم...یکی از مدل های خوب YOLO هستش...یه برنامه نوشتم براش و لینکش کردم به برنامه
نتیجه ی کار خوبه...ولی بازم باید روش کار کنم...تا خوب با برنامه مچ بشه....و چندتا آپدیت هم تو برنامه نیاز هست....فعلاً کارش تموم نشده...ولی اصل داستان چالش دوم رو تموم کردم (فیلم)

P.S
خب تقریباً الان اون Roadmap ای که چیده بودم داره به پایان میرسه...و به جزئیات ریز کار رسیدم.
P.SS
شاید وقت و حوصله کردم...کل گرافیک پروژه رو بردم روی Guna.UI که اگه این کار رو کنم، ظاهر برنامه به طرز چشمگیری قشنگ تر میشه....کلاً یکی از UI های مدرن هستش و کار کردن باهاش رو خیلی دوست دارم.
P.SS
هنوز پرامت ترجمه رو آپدیت نکردم و از هنوزم از نسخه ی قدیمی استفاده میکنم..در آینده یه بخشی قرار میدم تو برنامه که بشه اسم مانگا رو هم مشخص کرد...که هوش مصنوعی با توجه به موضوع مانگا، ترجمه بهتری رو بده...


ممنون لطف دارید...

با این وجود که تا همین الان هیچ وقت یک صفحه مانگا رو هم ترجمه نکردم :) ولی همیشه این خلاء رو تو زمینه ترجمه مانگا حس میکردم که چرا یه برنامه بومی سازی شده نداریم که بشه راحتر کار کرد.
وقتی فیلم های آموزشی ویراستاری مانگا رو توی Youtube میدیم....میگفتم خدایش کارشون سخته....

یکی باید متن انگلیسی رو از روی مانگا تایپ کنه تو word
یکی باید اون رو ترجمه کنه
یکی باید مانگا رو Clean کنه
یکی دیگه باید ترجمه ها رو بزاره تو جاهای درستش تو بالون ها

البته امروزه خیلی از این مراحل رو با هوش مصنوعی هم میشه انجام داد، ولی بازم دمشون گرم.

یکی از مشکلات مدل Yolo که باهاش فول اسکن میکردم (فیلم پست قبل)...بالون های دوقلو بودش...که این مدل باید بالون دوقلو خیلی ایده ال باشه تا اون رو نصف میکرد.

مثلاً مورد زیر رو

3.png

اینطوری تشخیص میده

balloon_8.png

و نتیجه فول اسکن رو خراب میکرد (بخاطر منطق ضعیف اون بودش)

2.png

امروز تو وقت بیکاری ـم با هوش مصنوعی درباره ی این مشکل کلی بحث کردیم....و به یه ایده ی جالب رسیدم....از چهار طرف عکس رو پیمایش میکینم و دره ها و قله ها رو حساب میکنیم....و بهشون امتیاز میدیم
بیشترین امتیاز...میشه جهت برش تصویر....و دوباره روی هر تصویر برش خورده یکبار دیگه این کار رو تکرار که کنیم...میتونیم بالون های 3قلو و 4قلو رو هم نصف کنیم....
اینطوری فرقی نداره بالون دوقلو عمودی باشه یا افقی....راه فراری از نصف شدن نداره....

نتیجه ی کار....

1.png

حتی اگه بالون از یک طرف یا دو طرف کامل صاف باشه....بازم قابل شناسایی هستش

balloon_2.png


4.png
 
دو روز بود دسترسی خوبی به نت نداشتم
نشستم Edens Zero و Fairy Tail که از قبل دانلود کرده بودم و نخونده بودم رو تموم کردم.

احساس می‌کنم دل پیچه غیر قابل درمانی گرفتم.
منم دارم سول ایتر میبینم که از چند سال قبل دانلود کرده بودم، تا اینجا که دیدم انیمه نابی بوده :D
 
جونم برات بگه...کدوم نسخه رو میگی

Reader edition - که فقط یه ایده ساده از نسخه اصلی برنامه بودش و فعلاً توسعه ـش نمیدم (بخاطر چالش دوم که بالا گفتم، البته همین الانش با این سیستم هم اوکی هستش) و تمام تمرکز ام روی Editor edition گذاشتم....
ولی خب هر دو شون الفا ورژن هستند...و معمولاً این نسخه ها عمومی نمیشه...حداقل باید به beta برسم....تا کسایی که استفاده میکنن بتونن باگ های برنامه رو بگن.

الان برنامه هیچ Setting و Option ای نداره که بشه المان های اون رو تغییر داد و تازه امروز بهش انتخاب فونت رو اضافه کردم... و گرنه همه مقدار ها ثابت تو برنامه ثبت شدن و این اصلاً جزء استانداردها نیست.

اینکه کی میرسم به این مرحله...واقعاً معلوم نیست...یه کار دلی هستش و سفارسی نیست که تایم لاین پیشرفت کار داشته باشه و هر وقت که فرصت کنم میشینم پاش و روش کار میکنم.

P.S
ولی قطعاً ادامه ـش میدم...و رایگان عمومی ـش میکنم :D قول میدم که مثل بقیه ی برنامه هام نشه


View attachment Record 2025 06 28 01 00 12 722.mp4

طی این دو هفته ی سختی که هممون داشتیم به سختی میتونستم تمرکز کنم روی این پروژه شخصی....ولی اون زمانی که اینترنت نداشتیم....یه فرصتی شد که بشینم و برای دور شدن از دنیا، روی برنامه کار کنم
تا جایی که شد، تمامی بخش هایی که تا الان ساخته شد رو بازبینی کردم و تمام اونها رو کالیبره کردم و فرصتی شد که setting هم ساخته بشه، که قسمت مهم برنامه یعنی کنترل مدل های هوش مصنوعی و پرامپت ها الان دست کاربر هستش و می‌تونه به سلیقه خودش و یا با موضوع مانگا اون رو ویرایش و تنظیم کنه و از چند مدل Gemini با پارامتر های مختلف (Temperature, Top p, Top k) رو بهره بگیره.

الان دیگه ۸۰درصد ایده های اولیه تقریبا برنامه نویسی شدن (چند مورد رو هنوز حوصله نکردم که درست ـشون کنم) و به پایان فاز آلفا ورژن رسیدیم...و فقط بخش user interface اون مونده که نیاز به یک همت عالی داره که تمامی دیزاینر برنامه از اول طراحی مدرن بشه...و یک ToolBox هم باید بهش اضافه کنم.

اگه ظاهر برنامه رو کلا قلم بگیریم الان تو فاز نسخه‌ی pre-beta هستم و دیگه کم کم باید درباره نحوه‌ی سازوکار انتشار برنامه، برنامه ریزی کنم.

P.S
احتمالش خیلی بالاس که از بستر فروم همینجا استفاده کنم و یه فراخوان محدود برای پیش بتا تستر بزنم...تا مشکلات برنامه روی سیستم های مختلف، مشخص و رفع بشه.
 
1751110189715.png

Grape-kun, a Humboldt penguin at Tobu Zoo in Japan, who became enamored with a cardboard cutout of Hululu, a character from the anime "Kemono Friends". This happened after his mate left him for another penguin, and the cutout was placed in his enclosure as part of a collaboration between the zoo and the anime. Grape-kun's story gained significant attention online, with many people sympathizing with his unusual romantic attachment

1751110253968.png
 

کاربرانی که این گفتگو را مشاهده می‌کنند

  • InfeR
  • H^D^
Top
رمز عبور خود را فراموش کرده اید؟
اگر میخواهی عضوی از بازی سنتر باشی همین حالا ثبت نام کن
or