কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তির উন্নয়নে আরও একধাপ এগিয়ে গেল ওপেনএআই। প্রতিষ্ঠানটি সম্প্রতি একটি নতুন অডিও মডেল উন্মোচন করেছে, যা ভয়েস এজেন্ট বা ভয়েস অ্যাসিস্ট্যান্টকে আরও বাস্তবসম্মত ও স্বতঃস্ফূর্তভাবে কথোপকথনের সক্ষমতা দেবে।
চ্যাটজিপিটির নির্মাতা ওপেনএআই জানিয়েছে, প্রাথমিকভাবে ডেভেলপারদের জন্য উন্মুক্ত করা এ মডেলটি উন্নত স্পিচ-টু-টেক্সট ও টেক্সট-টু-স্পিচ প্রযুক্তি ব্যবহার করে। ফলে এআই-ভিত্তিক ভয়েস এজেন্টগুলো আগের তুলনায় আরও নির্ভুল, দ্রুত ও মানবসদৃশভাবে কাজ করতে পারবে।
প্রযুক্তি বিশ্লেষকদের মতে, মুখের ভাষা যোগাযোগের সবচেয়ে স্বাভাবিক মাধ্যম হলেও কৃত্রিম বুদ্ধিমত্তা প্রযুক্তিতে তা এখনো পুরোপুরি কার্যকরভাবে ব্যবহার করা যায়নি। ওপেনএআইয়ের নতুন উদ্ভাবন সেই সীমাবদ্ধতা কাটিয়ে তোলার সম্ভাবনা তৈরি করেছে।
নতুন মডেলে আগের ‘Whisper’ সংস্করণের তুলনায় উন্নত স্পিচ-টু-টেক্সট সুবিধা যুক্ত করা হয়েছে, যা আরও দ্রুত ও নির্ভুলভাবে মুখের কথা লিখিত ভাষায় রূপান্তর করতে সক্ষম। একই সঙ্গে হালনাগাদ করা হয়েছে ‘Agents SDK’, যার মাধ্যমে ডেভেলপাররা পাঠ্যভিত্তিক এআই সহকারীকে ভয়েস-ভিত্তিক ইন্টারঅ্যাকশন সিস্টেমে রূপান্তর করতে পারবেন।
ওপেনএআই দাবি করেছে, নতুন অডিও মডেলটি আগের সংস্করণগুলোর তুলনায় সবচেয়ে কম বিভ্রান্তিকর তথ্য প্রদান করে এবং ব্যবহারকারীর সঙ্গে আরও প্রাসঙ্গিকভাবে যোগাযোগ স্থাপন করতে পারে। এ প্রযুক্তি গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যবহারকারীদের সহায়ক প্রযুক্তি হিসেবেও গুরুত্বপূর্ণ ভূমিকা রাখবে বলে আশা করা হচ্ছে।
বিশেষজ্ঞরা মনে করছেন, এই অডিও মডেল ভবিষ্যতের ভয়েস অ্যাসিস্ট্যান্ট ও এআই-চালিত কাস্টমার সার্ভিস সিস্টেমকে নতুন উচ্চতায় নিয়ে যেতে পারে।
মন্তব্য
এই নিবন্ধটি জন্য কোন মন্তব্য নেই.