র করে এখন বিনামনেটিজেনদের কাছে এআই দিয়ে ইমেজ তৈরী করা বর্তমানে একটি ট্রেন্ডিং বিষয়। যদিও বেশিরভাগ মানুষ এটাকে ফান বা আনন্দ হিসেবে ব্যবহার করছেন, তবুও অসংখ্য মানুষ এটাকে প্রফেশনালি ব্যবহার করছেন এবং এআই দিয়ে ইমেজ তৈরী করে অনেকে অনেক টাকা আয় করছেন। যে যে উদ্দেশ্যেই এআই দিয়ে ইমেজ তৈরী করুক না কেন, যারা প্রযুক্তিগত জ্ঞানে একটু পিছিয়ে তারা জানেন না কিভাবে এআই দিয়ে ইমেজ তৈরী করতে হয়। তাই সকলের কথা বিবেচনায় রেখে আজকের এই ব্লগ পোষ্টে দেখাব কিভাবে খুব সহজে এআই দিয়ে ইমেজ তৈরী করবেন। আপনার পছন্দমত ইমেজ তৈরি করার জন্য অবশ্যই পোস্টের পুরোটা পড়বেন।
এআই দিয়ে ইমেজ তৈরী করার নিয়ম
মূল বিষয়ে যাওয়ার আগে এআই বা আরটিফিশিয়াল ইন্টেলিজেন্স সম্পর্কে কিছু জানা দরকার। এআই (Artificial Intelligence – কৃত্রিম বুদ্ধিমত্তা) বর্তমানে একটি আলোচিত বিষয়। সর্বত্রই জয়জয়কার দেখা যাচ্ছে। যদিও কিছু কিছু ক্ষেত্রে এটি সমালোচিত হচ্ছে এবং পৃথিবীর অনেক দেশ এটার উপর নিষেধাজ্ঞা দিয়েছে, তবুও আমার মতে এটা যারা আধুনিক সভ্যতায় বিশ্বাস করে, প্রযুক্তি দিয়ে মানব জীবনকে আরো সহজ ভাবে পরিচালনা করতে চায় – তাদের জন্য এটা আশীর্বাদ স্বরুপ। বর্তমানে এআই দিয়ে ইমেজ তৈরীর পাশাপাশি ভিডিও তৈরি করা যাচ্ছে।
এটা আমাদের কাজের গতি অনেক পরিমাণে বাড়িয়ে দিয়েছে। এআই-এর ব্যবহার করে আমরা আমাদের ভিডিও স্ক্রিপ্ট, ব্লগ রাইটিং, আইডিয়া জেনারেট ইত্যাদি করতে পারি। আগে যেখানে একটা প্রজেক্ট শেষ করতে দশ জনের একটা টিম লাগতো, এআই-এর কল্যানে এখন সেই প্রজেক্ট শেষ করতে দুইজনের টিমই যথেষ্ট। এআই দিয়ে ইমেজ তৈরী করার জন্য ইন্টারনেটে অসংখ্য পরিমাণ টুলস এবং ওয়েবসাইট রয়েছে। কিন্তু বেশিরভাগ টুলস এবং ওয়েবসাইট দিয়ে বিনামূল্যে ছবি বা ভিডিও তৈরি করা যায় না, প্রিমিয়াম ভার্সন কিনতে হয়। যেটার পরিমাণ বছরে ১৫ থেকে ২০ হাজার টাকা বা তার অধিক হয়ে থাকে। আজকে আমি আপনাদের দেখাবো কিভাবে বিনামূল্যে এআই দিয়ে আনলিমিটেড পরিমাণ ইমেজ তৈরী করতে পারবেন।
আপনার কম্পিউটারের মজিলা ফায়ারফক্স, গুগল ক্রোম বা ব্রেভ যে কোন একটি ব্রাউজার ওপেন করুন। তারপর ব্রাউজার এর এড্রেস বারে টাইপ করুন https://github.com/lllyasviel/Fooocus এবং তারপর ইন্টার বাটনে একটি চাপ দিন, অথবা সরাসরি এই লিঙ্কে ক্লিক করুন। তাহলে আপনি গিটহাব ওয়েবসাইটের এরকম একটি ইন্টারফেইস দেখতে পাবেন।
তারপর নিচের দিকে স্ক্রোল করতে থাকুন। নিচের ছবিতে দেখানো Colab সেকশনে Open in Colab বাটনে ক্লিক করুন। অথবা সরাসরি এই লিংকে ক্লিক করতে পারেন।
Open in Colab বাটনে ক্লিক করার পর আপনি এরকম একটি ইন্টারফেইস দেখতে পাবেন।
উপরের ছবিতে দেখানো প্রথমে নির্দিষ্ট তীর চিহ্নিত স্থানে অর্থাৎ Connect বাটনে একটা চাপ দিন এবং কিছুক্ষণ অপেক্ষা করুন, কানেক্ট হয়ে যাবে। তারপর দ্বিতীয় তীর চিহ্নিত নির্দিষ্ট প্লে (▶️) আইকনে চাপ দিন। তখন এরকম একটি ওয়ার্নিং পপ-আপ দেখাতে পারে Warning: This notebook was not authored by Google সেটাতে Run anyway বাটনে চাপ দিন।
তারপর আপনাকে বেশ কিছুক্ষণ সময় অপেক্ষা করতে হবে, ৮/১০ মিনিটের মত। পাইথনের কিছু টুলস ইন্সটল হবে। আপনার ইন্টারনেট স্পিড এবং পিসির কনফিগারেশনের উপর এটা নির্ভর করে সময় কম-বেশি লাগতে পারে। আপনার ইন্টারনেট স্পিড এবং পিসির কনফিগারেশন যত ভালো হবে তত দ্রুত টুলস গুলো ইন্সটল হয়ে যাবে। সবকিছু সঠিকভাবে সম্পন্ন হলে নিজের চিত্রে দেখানো মত কমান্ড লাইনের ভিতরে App started successful এরকম একটি মেসেজ দেখতে পারবেন এবং সাথে অ্যাপের একটি লাইভ লিংক বা ইউআরএল দেখতে পাবেন, যেটা নিচের চিত্রে তীর চিহ্নের মাধ্যমে দেখানো হয়েছে।
অ্যাপের মধ্যে জেনারেটেড হওয়া লিংকে রাইট ক্লিক করে Open link in new tab এ ক্লিক করুন। তাহলে নতুন একটি ট্যাবে লিংকটি ওপেন এবং যেটা দেখতে হবে নিচের ইমেজের মত। কিন্ত অ্যাপের ট্যাব ক্লোজ করবেন না, ওটা ওপেন রাখতে হবে। নিচের ছবিতে কয়েকটি গুরুত্বপূর্ণ বিষয় খেয়াল করুন। প্রথমে আছে একটি আউটপুট বক্স; তার নিচে আছে প্রুম্পট ইনপুট বক্স, এখানে আমরা কোন ধরনের ইমেজ তৈরি করতে চাই তার সংক্ষিপ্ত বিবরণ লিখব; তার পাশে আছে Generate বাটন, প্রুম্পট লেখার পর এই বাটনে চাপ দিলে ইমেজ জেনারেট হওয়া শুরু করবে; নিচে আছে দুইটা চেকবক্স- Input Image এবং Advanced.
এখন খুব সহজভাবে প্রুম্পট লিখে কিভাবে এআই দিয়ে ইমেজ তৈরী করা যায় তা দেখাচ্ছি। ধরা যাক, আমি একটা ফানি (মজাদার) ইমেজ তৈরি করতে চাই যেখানে দেখা যাবে ফেসবুকের প্রতিষ্ঠাতা, বিশ্বের অন্যতম ধনী মার্ক জাকারবার্গ ছেড়া-ফাটা পোশাক পরে একটা বস্তির মধ্যে বসে ভিক্ষা করছে 😊 এটা শুধুমাত্র মজার জন্য, সিরিয়াস ভাবে কেউ নিবে না🙅♂️ এজন্য আমি প্রুম্পট বক্সে লিখলাম – Mark Zuckerberg begging in a slum with torn clothes. এবং তারপর পাশে থাকা Generate বাটনে চাপ দিলাম।
কিছুক্ষণ অপেক্ষা করার পর আমরা স্ক্রিনে আমাদের প্রুম্পট অনুযায়ী আউটপুট দেখতে পাবো। অর্থাৎ এআই প্রুম্পট অনুযায়ী ইমেজ তৈরি করে দিয়েছে। এখন আমরা চাইলে রাইট ক্লিক করে Save image as এ ক্লিক করে ইমেজটি ডাউনলোড করে নিতে পারি।
আপনি যদি এই আউটপুটে সন্তুষ্ট না হন অথবা বিশেষ সাইজের, অন্য ফরমেটের ইমেজ চান তাহলে নিচের Advanced চেক বক্সে ক্লিক করুন। তাহলে নিচে প্রদর্শিত ইমেজের ন্যায় এডভ্যান্সড অপশনগুলা দেখা যাবে। যেখান থেকে আপনি ইমেজ সেটিং, স্টাইল, মডেল, আউটপুট ফরম্যাট, কতগুলা ইমেজ আউটপুট হিসাবে চান ইত্যাদি অপশন দেখতে পাবেন। আপনার পছন্দমত অপশন সিলেক্ট করে প্রুম্পট লিখে আবার Generate বাটনে চাপ দিন। তাহলে আপনার পছন্দমত ইমেজ জেনারেট হয়ে যাবে।
এভাবেই আপনি এআই দিয়ে ইমেজ তৈরী করতে পারেন।
কেন আমরা এআই দিয়ে ইমেজ তৈরী করব
এআই বা আর্টিফিসিয়াল ইন্টেলিজেন্স বিপুল পরিমাণ ডাটার মধ্য থেকে জ্ঞান আহরণ এবং তা ব্যবহার করে মানুষের মতো কাজ করার শক্তিশালী একটি প্রযুক্তি। এআই প্রযুক্তির অগ্রগতির কারণে ইমেজ তৈরিতে এসেছে এক অভাবনীয় পরিবর্তন। এর ফলে ছবি এডিটিং, গ্রাফিক ডিজাইন এবং বিজ্ঞাপনের মতো শিল্পক্ষেত্রে নতুন নতুন সুযোগ উন্মুক্ত হচ্ছে। এআই দ্বারা ইমেজ তৈরির সুবিধাগুলো হল-
সময় বাঁচেঃ এআই এর মাধ্যমে সৃজনশীলতা এবং শিল্প কার্যে দক্ষতা বাড়ে। এআই যান্ত্রিক এবং পুনরাবৃত্তিমূলক কাজগুলো দ্রুত সম্পাদন করে, যার ফলে মানুষ সৃজনশীলতার কাজে আরও বেশি সময় দিতে পারে।
ভাল মানের ছবিঃ এআই বিভিন্ন রকমের ছবি এডিটিং-এ ব্যবহার করা হয়। যেমন- এআই অটো-ক্যালিব্রেশন টুলগুলির সাহায্যে রং সংশোধন করতে, বিভিন্ন বস্তুর ব্যাকগ্রাউন্ড পরিবর্তন করতে, অথবা ছবি হাই রেজুলেশন করার মাধ্যমে উন্নত ছবি তৈরি করে।
স্বয়ংক্রিয়তাঃ ভিজ্যুয়াল কন্টেন্ট সৃষ্টির ক্ষেত্রে এআই অটোমেশন এক অভিনব পন্থা হিসেবে কাজ করে। এটি জটিল ডিজাইন এবং ইমেজ প্রসেসিং কাজকে স্বয়ংক্রিয় করতে পারে, যা সাধারণত সময় এবং মানব-সম্পদ অনেক ব্যয় করে। এর ফলে, ডিজাইনাররা তাদের ক্রিয়েটিভিটিকে আরও বিকাশ করতে পারেন এবং উৎপাদন প্রক্রিয়াকে দ্রুত এগিয়ে নিয়ে যেতে পারেন।
বহুজাতিক বিষয়ঃ এআই বিভিন্ন কাল্চার এবং সমাজের সাথে অনুমিত ছবি তৈরি করতে দক্ষ। যেকোনো সাংস্কৃতিক প্রসঙ্গ অনুযায়ী এটি ছবির উপাদানগুলোকে অভিযোজিত করতে সক্ষম, যা স্থানীয়করণের প্রক্রিয়াকে সহজ করে। যেমনঃ আপনি যদি কোন ব্যক্তির ছবি জেনারেট করতে এবং প্রুম্পটের মধ্যে ইন্ডিয়া বা আমেরিকা লিখে দেন, তাহলে সেই দেশের মানুষের ফেইসের সাথে সংগতি রেখে ইমেজ জেনারেট করবে।
স্কেলেবিলিটিঃ গ্রাফিক ডিজাইন এবং ইমেজ প্রসেসিং কাজে এআই বড় টীমের মত কাজ করতে অয়ারে। এরফলে হিউম্যান টীম আরও সুসংবদ্ধ এবং দক্ষতার সাথে বড় প্রকল্পগুলি হ্যান্ডেল করতে পারে।
কাস্টমাইজেশনঃ এআই ব্যবহারকারীর পছন্দ অনুযাযী ইমেজ তৈরি ও কাস্টমাইজেশনে সহায়তা করে। প্রতিটি ব্যবহারকারী যাতে তার চাহিদা মোতাবেক ইমেজ পায় সেজন্য এআই ইউজারের পূর্বাপর হিস্টোরী ও প্রফাইল ট্রাক করে কাস্টমাইজড ইমেজ জেনারেট করে।