মিডিয়া ফাইলের সাথে প্রম্পটিং


Gemini API টেক্সট, ইমেজ, অডিও এবং ভিডিও ডেটা সহ প্রম্পটিং সমর্থন করে, যা মাল্টিমোডাল প্রম্পটিং নামেও পরিচিত, যার অর্থ আপনি আপনার প্রম্পটে এই ধরনের মিডিয়া ফাইলগুলি অন্তর্ভুক্ত করতে পারেন। ছোট ফাইলগুলির জন্য, আপনি প্রম্পট প্রদান করার সময় সরাসরি একটি স্থানীয় ফাইলে জেমিনি মডেল নির্দেশ করতে পারেন। প্রম্পটে অন্তর্ভুক্ত করার আগে ফাইল API এর সাথে বড় ফাইলগুলি আপলোড করুন৷

ফাইল API আপনাকে প্রতি প্রকল্পে 20GB পর্যন্ত ফাইল সংরক্ষণ করতে দেয়, প্রতিটি ফাইলের আকার 2GB-এর বেশি নয়। ফাইলগুলি 48 ঘন্টার জন্য সংরক্ষণ করা হয় এবং সেই সময়ের মধ্যে প্রজন্মের জন্য আপনার API কী দিয়ে অ্যাক্সেস করা যেতে পারে এবং API থেকে ডাউনলোড করা যাবে না। Gemini API পাওয়া যায় এমন সমস্ত অঞ্চলে Files API বিনা মূল্যে পাওয়া যায়।

ফাইল API ইনপুটগুলি পরিচালনা করে যা model.generateContent বা model.streamGenerateContent দিয়ে সামগ্রী তৈরি করতে ব্যবহার করা যেতে পারে। বৈধ ফাইল ফরম্যাট (MIME প্রকার) এবং সমর্থিত মডেলের তথ্যের জন্য, সমর্থিত ফাইল ফরম্যাট দেখুন।

এই গাইডটি দেখায় কিভাবে ফাইল API ব্যবহার করে মিডিয়া ফাইল আপলোড করতে হয় এবং সেগুলিকে Gemini API-তে GenerateContent কলে অন্তর্ভুক্ত করতে হয়। আরও তথ্যের জন্য, কোড নমুনা দেখুন।

সমর্থিত ফাইল ফরম্যাট

জেমিনি মডেল একাধিক ফাইল ফরম্যাটের সাথে প্রম্পটিং সমর্থন করে। এই বিভাগটি প্রম্পট করার জন্য সাধারণ মিডিয়া ফর্ম্যাটগুলি ব্যবহার করার ক্ষেত্রে বিবেচ্য বিষয়গুলি ব্যাখ্যা করে, বিশেষ করে ছবি, অডিও, ভিডিও এবং প্লেইন টেক্সট ফাইল৷ আপনি মিডিয়া ফাইলগুলিকে শুধুমাত্র নির্দিষ্ট মডেল সংস্করণের সাথে প্রম্পট করার জন্য ব্যবহার করতে পারেন, যেমনটি নিম্নলিখিত টেবিলে দেখানো হয়েছে।

মডেল ছবি শ্রুতি ভিডিও সরল পাঠ্য
Gemini 1.5 Pro (রিলিজ 008 এবং পরবর্তী) ✔ (সর্বোচ্চ 3600 ইমেজ ফাইল)

ইমেজ ফরম্যাট

আপনি Gemini 1.5 মডেলের সাথে প্রম্পট করার জন্য ইমেজ ডেটা ব্যবহার করতে পারেন। আপনি যখন প্রম্পট করার জন্য ছবিগুলি ব্যবহার করেন, তখন সেগুলি নিম্নলিখিত সীমাবদ্ধতা এবং প্রয়োজনীয়তার সাপেক্ষে থাকে:

  • চিত্রগুলি অবশ্যই নিম্নলিখিত চিত্র ডেটা MIME প্রকারগুলির মধ্যে একটিতে থাকতে হবে:
    • PNG - ছবি/পিএনজি
    • JPEG - ছবি/jpeg
    • WEBP - ছবি/ওয়েবপি
    • HEIC - চিত্র/heic
    • HEIF - image/heif
  • জেমিনি 1.5 মডেলের জন্য সর্বাধিক 3600টি ছবি।
  • একটি ছবিতে পিক্সেল সংখ্যার কোন নির্দিষ্ট সীমা নেই; যাইহোক, বৃহত্তর চিত্রগুলিকে তাদের আসল আকৃতির অনুপাত সংরক্ষণ করার সময় সর্বাধিক 3072 x 3072 রেজোলিউশনে ফিট করার জন্য ছোট করা হয়।

অডিও ফরম্যাট

আপনি Gemini 1.5 মডেলের সাথে প্রম্পট করার জন্য অডিও ডেটা ব্যবহার করতে পারেন। আপনি যখন প্রম্পট করার জন্য অডিও ব্যবহার করেন, তখন সেগুলি নিম্নলিখিত সীমাবদ্ধতা এবং প্রয়োজনীয়তার সাপেক্ষে থাকে:

  • অডিও ডেটা নিম্নলিখিত সাধারণ অডিও বিন্যাস MIME প্রকারে সমর্থিত:
    • WAV - অডিও/wav
    • MP3 - অডিও/mp3
    • AIFF - অডিও/এআইএফএফ
    • AAC - অডিও/aac
    • OGG Vorbis - অডিও/ogg
    • FLAC - অডিও/flac
  • একক প্রম্পটে অডিও ডেটার সর্বাধিক সমর্থিত দৈর্ঘ্য হল 9.5 ঘন্টা।
  • অডিও ফাইলগুলিকে 16 কেবিপিএস ডেটা রেজোলিউশনে পুনরায় স্যাম্পল করা হয় এবং অডিওর একাধিক চ্যানেল একটি একক চ্যানেলে একত্রিত হয়।
  • একটি একক প্রম্পটে অডিও ফাইলের সংখ্যার কোন নির্দিষ্ট সীমা নেই; যাইহোক, একটি একক প্রম্পটে সমস্ত অডিও ফাইলের মোট সম্মিলিত দৈর্ঘ্য 9.5 ঘন্টার বেশি হতে পারে না।

ভিডিও ফরম্যাট

আপনি Gemini 1.5 মডেলের সাথে প্রম্পট করার জন্য ভিডিও ডেটা ব্যবহার করতে পারেন।

  • ভিডিও ডেটা নিম্নলিখিত সাধারণ ভিডিও বিন্যাস MIME প্রকারে সমর্থিত:

    • ভিডিও/mp4
    • ভিডিও/এমপিইজি
    • ভিডিও/মুভ
    • ভিডিও/এভি
    • ভিডিও/x-flv
    • ভিডিও/এমপিজি
    • ভিডিও/ওয়েবএম
    • ভিডিও/ডাব্লুএমভি
    • video/3gpp
  • ফাইল এপিআই পরিষেবা 1 ফ্রেম প্রতি সেকেন্ডে (এফপিএস) ভিডিওগুলিকে চিত্রগুলিতে নমুনা করে এবং সেরা অনুমান গুণমান প্রদানের জন্য পরিবর্তন করা হতে পারে৷ রেজোলিউশন এবং গুণমান নির্বিশেষে পৃথক ছবি 258 টোকেন নেয়।

প্লেইন টেক্সট ফরম্যাট

ফাইল API নিম্নলিখিত MIME প্রকারের সাথে প্লেইন টেক্সট ফাইল আপলোড করা সমর্থন করে:

  • টেক্সট/প্লেইন
  • টেক্সট/এইচটিএমএল
  • টেক্সট/সিএসএস
  • পাঠ্য/জাভাস্ক্রিপ্ট
  • অ্যাপ্লিকেশন/এক্স-জাভাস্ক্রিপ্ট
  • টেক্সট/এক্স-টাইপস্ক্রিপ্ট
  • অ্যাপ্লিকেশন/এক্স-টাইপস্ক্রিপ্ট
  • পাঠ্য/সিএসভি
  • পাঠ্য/মার্কডাউন
  • টেক্সট/এক্স-পাইথন
  • অ্যাপ্লিকেশন/এক্স-পাইথন-কোড
  • অ্যাপ্লিকেশন/জেসন
  • টেক্সট/এক্সএমএল
  • অ্যাপ্লিকেশন/আরটিএফ
  • টেক্সট/আরটিএফ

একটি MIME প্রকারের প্লেইন টেক্সট ফাইলগুলির জন্য যেগুলি তালিকায় নেই, আপনি উপরের MIME প্রকারগুলির একটি ম্যানুয়ালি নির্দিষ্ট করার চেষ্টা করতে পারেন৷