دستگاههای آینده اپل (Apple) ممکن است به قابلیت لبخوانی مجهز شوند تا کاربر دیگر برای ارائه فرامین به سیری (Siri) نیازی به میکروفون نداشته باشد. در ادامه این خبر با مایکت همراه باشید.
- مقایسه هدست واقعیت ترکیبی Apple Vision Pro و Meta Quest 3
- دوربین آیفون 15 بهبود پیدا خواهد کرد؟
- آیفون 15 را فراموش کنید، احتمالا آیفون رولشونده در راه است!
اگر سن کمی نداشته باشید، احتمالا اضافه شدن قابلیت لبخوانی به سیری شما را کم و بیش به یاد کتاب 2001: A Space Odyssey، نوشته آرتور سی. کلارک یا فیلم آن که توسط استنلی کوبریک کارگردانی شده است، میاندازد. امیدواریم این موضوع در عمل هم همینطور باشد و قابلیت لبخوانی به اندازه آن چه از HAL 9000 دیدیم دقیق عمل کند.
البته سیری در این مقایسه ضعف بیشتری در تشخیص و فهم فرمانهای صوتی دارد، اما در عوض تا به حال تلاش نکرده خدمه یک فضاپیما را قتلعام کند. این به آن در.
به طور کلی اضافه شدن قابلیت تشخیص حرکت لب و سر برای لبخوانی میتواند به افزایش دقت سیری کمک کند. اخیرا مشخص شده که پتنت (Patent) جدیدی تحت عنوان «تشخیص کلمه کلیدی با استفاده از حسگر حرکتی» با همین هدف توسط اپل به ثبت رسیده است.
در اسناد مربوط به این پتنت نوشته شده: «دادهها از طریق سنسور حرکتی دریافت میشوند به این نحو که مثلا زمانی که کاربر صحبت میکند، حرکات او ثبت میشود. سپس تشخیص داده میشود که دادههای حرکتی با دادههای مرجع (که شامل چندین کلمه یا عبارت هستند) مطابقت دارد یا نه.» اپل در ادامه ذکر کرده که: «پاسخ سیستم (فقط) صوتی در صورتی که سنسور صوتی صدا را به صورت ناخواسته یا به اشتباه دریافت کند میتواند منجر به پاسخ مثبت نادرست شود.» در این اسناد توضیح داده شده که حرکات دهان چطور با دادههای پیشین سیری یا دیگر سیستمها مقایسه میشوند.
با این وجود باید بگوییم که این پتنت صرفا برای بهبود عملکرد سیری نیست و اپل آن را ثبت نکرده تا دستگاههایاش در آینده نیازی به میکروفون نداشته باشند. بلکه اپل صرفا میخواهد با اضافه کردن این سنسور تشخیص حرکت کاری کند که کاربران بتوانند در موقع لزوم میکروفون را غیرفعال کنند و برای استفاده از دستیار صوتی دیگر مجبور نباشند عبارت Siri یا Hey Siri را به زبان آورند.
در این اسناد همچنین نوشته شده که: «وقتی یک کاربر صحبت میکند، دهان، صورت، سر و گردن دچار حرکت و لرزش میشود. سنسورهای حرکتی نظیر شتابسنج و ژیروسکوپ قابلیت تشخیص این حرکات را دارند و در مقایسه با سنسورهای صوتی مانند میکروفون، انرژی نسبتا کمتری مصرف میکنند.»
حالا سنسور تشخیص حرکت میتواند حرات را با آن چه پیشتر ضبط شده مقایسه کرده و در نتیجه وقتی میگویید Hey Siri به سرعت عمل میکند. این موضوع در خصوص دیگر فرامین صوتی مثل Next track هم صادق است. البته انتظار نداشته باشید وقتی عبارت کمتر کاربردی مثل «Hey, Siri, open the pod bay doors» را بیان میکنید اتفاقی رخ دهد.
اما در هر حال تشخیص حرکت به قدری سریع خواهد بود که وقتی کاربر میگوید «Siri»، دستگاه به سرعت میکروفون را فعال میکند تا بتواند باقی فرمان صوتی را به شکل دقیق تشخیص دهد. ،پتنت اپل به غیر از سنسورهای شتابسنج و ژیروسکوب، دیگر اشارهای نمیکند که چه چیزهایی در این امر نقش دارند.
پس سنسور حرکتی قرار نیست از طریق دوربین گوشی کار کند، پس میتوان انتظار داشت که در دیگر دستگاههای اپل مثل ایرپادها یا Apple Vision Pro هم بتوانیم در آینده شاهد چنین قابلیتی باشیم.
در این پتنت نام دو شخص آمده که یکی از آنها مادو چینتاکونتا است. او پیشتر در ثبت پتنتی که مربوط به انجام هماهنگیهای و برقرار تماسهای به صورت خودکار بود هم نقش داشته است.
منبع: AppleInsider