নতুন এআই অডিও মডেল তৈরি করেছে ওপেনএআই, যে সুবিধা পাওয়া যাবে

calendar_month ২২ মার্চ ২০২৫ ১৯:২২:০৬ person অনলাইন ডেস্ক

কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তির উন্নয়নে আরও একধাপ এগিয়ে গেল ওপেনএআই। প্রতিষ্ঠানটি সম্প্রতি একটি নতুন অডিও মডেল উন্মোচন করেছে, যা ভয়েস এজেন্ট বা ভয়েস অ্যাসিস্ট্যান্টকে আরও বাস্তবসম্মত ও স্বতঃস্ফূর্তভাবে কথোপকথনের সক্ষমতা দেবে।

চ্যাটজিপিটির নির্মাতা ওপেনএআই জানিয়েছে, প্রাথমিকভাবে ডেভেলপারদের জন্য উন্মুক্ত করা এ মডেলটি উন্নত স্পিচ-টু-টেক্সট ও টেক্সট-টু-স্পিচ প্রযুক্তি ব্যবহার করে। ফলে এআই-ভিত্তিক ভয়েস এজেন্টগুলো আগের তুলনায় আরও নির্ভুল, দ্রুত ও মানবসদৃশভাবে কাজ করতে পারবে।

প্রযুক্তি বিশ্লেষকদের মতে, মুখের ভাষা যোগাযোগের সবচেয়ে স্বাভাবিক মাধ্যম হলেও কৃত্রিম বুদ্ধিমত্তা প্রযুক্তিতে তা এখনো পুরোপুরি কার্যকরভাবে ব্যবহার করা যায়নি। ওপেনএআইয়ের নতুন উদ্ভাবন সেই সীমাবদ্ধতা কাটিয়ে তোলার সম্ভাবনা তৈরি করেছে।

নতুন মডেলে আগের ‘Whisper’ সংস্করণের তুলনায় উন্নত স্পিচ-টু-টেক্সট সুবিধা যুক্ত করা হয়েছে, যা আরও দ্রুত ও নির্ভুলভাবে মুখের কথা লিখিত ভাষায় রূপান্তর করতে সক্ষম। একই সঙ্গে হালনাগাদ করা হয়েছে ‘Agents SDK’, যার মাধ্যমে ডেভেলপাররা পাঠ্যভিত্তিক এআই সহকারীকে ভয়েস-ভিত্তিক ইন্টারঅ্যাকশন সিস্টেমে রূপান্তর করতে পারবেন।

ওপেনএআই দাবি করেছে, নতুন অডিও মডেলটি আগের সংস্করণগুলোর তুলনায় সবচেয়ে কম বিভ্রান্তিকর তথ্য প্রদান করে এবং ব্যবহারকারীর সঙ্গে আরও প্রাসঙ্গিকভাবে যোগাযোগ স্থাপন করতে পারে। এ প্রযুক্তি গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যবহারকারীদের সহায়ক প্রযুক্তি হিসেবেও গুরুত্বপূর্ণ ভূমিকা রাখবে বলে আশা করা হচ্ছে।

বিশেষজ্ঞরা মনে করছেন, এই অডিও মডেল ভবিষ্যতের ভয়েস অ্যাসিস্ট্যান্ট ও এআই-চালিত কাস্টমার সার্ভিস সিস্টেমকে নতুন উচ্চতায় নিয়ে যেতে পারে।

কৃত্রিম বুদ্ধিমত্তা