قابلیت لب‌خوانی به سیری اضافه می‌شود

دستگاه‌های آینده اپل (Apple) ممکن است به قابلیت لب‌خوانی مجهز شوند تا کاربر دیگر برای ارائه فرامین به سیری (Siri) نیازی به میکروفون نداشته باشد. در ادامه این خبر با مایکت همراه باشید.

اگر سن کمی نداشته باشید، احتمالا اضافه شدن قابلیت لب‌خوانی به سیری شما را کم و بیش به یاد کتاب 2001: A Space Odyssey، نوشته آرتور سی. کلارک یا فیلم آن که توسط استنلی کوبریک کارگردانی شده است، می‌اندازد. امیدواریم این موضوع در عمل هم همین‌طور باشد و قابلیت لب‌خوانی به اندازه آن چه از HAL 9000 دیدیم دقیق عمل کند.

البته سیری در این مقایسه ضعف بیش‌تری در تشخیص و فهم فرمان‌های صوتی دارد، اما در عوض تا به حال تلاش نکرده خدمه یک فضاپیما را قتل‌عام کند. این به آن در.

به طور کلی اضافه شدن قابلیت تشخیص حرکت لب و سر برای لب‌خوانی می‌تواند به افزایش دقت سیری کمک کند. اخیرا مشخص شده که پتنت (Patent) جدیدی تحت عنوان «تشخیص کلمه کلیدی با استفاده از حسگر حرکتی» با همین هدف توسط اپل به ثبت رسیده است.

در اسناد مربوط به این پتنت نوشته شده: «داده‌ها از طریق سنسور حرکتی دریافت می‌شوند به این نحو که مثلا زمانی که کاربر صحبت می‌کند، حرکات او ثبت می‌شود. سپس تشخیص داده می‌شود که داده‌های حرکتی با داده‌های مرجع (که شامل چندین کلمه یا عبارت هستند) مطابقت دارد یا نه.» اپل در ادامه ذکر کرده که: «پاسخ سیستم (فقط) صوتی در صورتی که سنسور صوتی صدا را به صورت ناخواسته یا به اشتباه دریافت کند می‌تواند منجر به پاسخ مثبت نادرست شود.» در این اسناد توضیح داده شده که حرکات دهان چطور با داده‌های پیشین سیری یا دیگر سیستم‌ها مقایسه می‌شوند.

با این وجود باید بگوییم که این پتنت صرفا برای بهبود عملکرد سیری نیست و اپل آن را ثبت نکرده تا دستگاه‌های‌اش در آینده نیازی به میکروفون نداشته باشند. بلکه اپل صرفا می‌خواهد با اضافه کردن این سنسور تشخیص حرکت کاری کند که کاربران بتوانند در موقع لزوم میکروفون را غیرفعال کنند و برای استفاده از دستیار صوتی دیگر مجبور نباشند عبارت Siri یا Hey Siri را به زبان آورند.

قابلیت لب‌خوانی به سیری اضافه می‌شود

در این اسناد همچنین نوشته شده که: «وقتی یک کاربر صحبت می‌کند، دهان، صورت، سر و گردن دچار حرکت و لرزش می‌شود. سنسورهای حرکتی نظیر شتاب‌سنج و ژیروسکوپ قابلیت تشخیص این حرکات را دارند و در مقایسه با سنسورهای صوتی مانند میکروفون، انرژی نسبتا کم‌تری مصرف می‌کنند.»

حالا سنسور تشخیص حرکت می‌تواند حرات را با آن چه پیش‌تر ضبط شده مقایسه کرده و در نتیجه وقتی می‌گویید Hey Siri به سرعت عمل می‌کند. این موضوع در خصوص دیگر فرامین صوتی مثل Next track هم صادق است. البته انتظار نداشته باشید وقتی عبارت کم‌تر کاربردی مثل «Hey, Siri, open the pod bay doors» را بیان می‌کنید اتفاقی رخ دهد.

اما در هر حال تشخیص حرکت به قدری سریع خواهد بود که وقتی کاربر می‌گوید «Siri»، دستگاه به سرعت میکروفون را فعال می‌کند تا بتواند باقی فرمان صوتی را به شکل دقیق تشخیص دهد. ،پتنت اپل به غیر از سنسورهای شتاب‌سنج و ژیروسکوب، دیگر اشاره‌ای نمی‌کند که چه چیزهایی در این امر نقش دارند.

پس سنسور حرکتی قرار نیست از طریق دوربین گوشی کار کند، پس می‌توان انتظار داشت که در دیگر دستگاه‌های اپل مثل ایرپادها یا Apple Vision Pro هم بتوانیم در آینده شاهد چنین قابلیتی باشیم.

در این پتنت نام دو شخص آمده که یکی از آن‌ها مادو چینتاکونتا است. او پیش‌تر در ثبت پتنتی که مربوط به انجام هماهنگی‌های و برقرار تماس‌های به صورت خودکار بود هم نقش داشته است.

منبع: AppleInsider

 

دکمه بازگشت به بالا
دانلود مایکت ×