تشخیص هویت از روی الگوی راه رفتن

تشخیص هویت از روی الگوی راه رفتن

بسیاری از مردم، آشنایان خود را از نوع راه رفتن تشخیص می دهند. البته این تنها نوع راه رفتن آ نها نیست که باعث شناسایی آ نها میشود، بلکه مدل مو یا لباس پوشیدن نیز به این تشخیص کمک میکند. در اینجا، احتمال شناسایی افراد از طرز راه رفتن آ نها با رو شهای بینایی ماشین، بررسی می شود. مطالعات قابل توجهی در مورد نوع راه رفتن در شاخه های مختلف انجام شده است، گرچه ترکیب ایده ها در شاخه های مختلف کم صورت گرفته و به پربارکردن موضوع کمک چندانی نکرده است ولی علامت های روانشناختی طرز راه رفتن در برخی موارد مورد استفاده قرار گرفته است.

میان این کارها، تکنیک های مختلفی برای شناسایی افراد از روی راه رفتن آ نها مورد توجه است. هیچکدام از این تکنیکها از یک توپولوژی مکانیکی یا مطالعات پزشکی خاصی استفاده نمیکنند، و بیشتر بر معیارهای آماری و مکاشف های تکیه می کنند.

مطالعات پزشکی

هدف اکثر تحقیقات بر روی راه رفتن انسان، کلا سبندی اجزای راه رفتن است. الگوی حرکتی استاندارد برای افراد عادی را تولید و با الگوهای راه ر فتن ماهنامه بين المللى فنى، مهندسى، خبرى- تحليلى- اطلاع رسانى آموزشى- پژوهش افراد بیمار مقایسه کرده اند. هیچ نوع تحلیل آماری یا ریاضی بر روی اطلاعات جمع آوری شده انجام نشده است. طرز راه رفتن را با عبارت "یک سیکل کامل راه رفتن" تعریف کرده است، عمل راه رفتن را میتوان یک سیگنال متناوب با یک طیف فرکانسی پیوسته دانست. محتویات فرکانس داده های جنبش شناسی راه رفتن را مورد بررسی قرار داده و نشان میدهد که راه رفتن معمولی دارای جزء فرکانسی بیشینه ی ۶ هرتز است، و اینکه داده های جنبشی راه رفتن را میتوان توسط تعداد محدودی جزء فرکانسی نشان داد.

 

توصیف راه رفتن

برای توصیف سیکل راه رفتن عبارات زیر را استفاده میکند. یک سیکل راه رفتن (Gait Cycle) فاصله ی زمانی بین گام های متوالی تماس پا به زمین (ضربه پاشنه) برای یک پا، است. هر پا دو پریود مختلف دارد، فاز ایستادن (Stance) که در آن پا از زمین که پا با زمین در تماس است وفازنوسان (Swing)  جدا شده و به طرف جلو در حرکت است. سیکل با برخورد یک یا (مثلا پای چپ) با زمین شروع میشود. این شروع فاز ایستان محسوب میشود. مچ پا منقبض شده و پای چپ را به جلو برده و به حالت صاف روی زمین قرار میدهد، وزن بدن به پای چپ منتقل میشود. پای راست به طرف  جلو (جلوتر از پای چپ) حرکت می کند و در همین حین پاشنه پای چپ از زمین جدا میشود. وزن بدن به پای راست منتقل شده، زانوی چپ خم میشود. بقیه پای چپ که اکنون در پشت واقع شده، از زمین بلند شده و فاز ایستادن با جدا شدن انگشتان تمام میشود.

شروع فاز نوسان زمانی آغاز میشود که انگشتان پای چپ از زمین جدا می شوند. وزن بدن به پای راست منتقل شده، پای چپ به سمت جلوی پای راست حرکت کرده و با زمین برخورد میکند.

سیکل راه رفتن با برخورد پاشنه چپ به زمین به پایان م یرسد. طول گام  (Stride Length) فاصله ی خطی در صفحه راه رفتن بین دو نقطه متوالی ، فاصله بین نقاط تماس یک پا با زمین است. طول قدم  (Step Length)  تماس متوالی دو پای مختلف است. یک قدم، حرکت بین ضربات پاشنه ی متوالی پاهای مختلف است.

مفهوم مهم دیگری که در رابطه با راه رفتن انسان در مقالات و مطالعات مختلف مورد استفاده قرار میگیرد، تصویر نیم رخ دو دویی این تصویر که شکل بدن انسان در حال راه رفتن را از کنار به صورت سیاه (پس زمینه) و سفید شخص در حال حرکت م یدهد، در بسیاری از الگوریتم های شناسایی هویت از روی راه رفتن، رکن اساسی را تشکیل  میدهد

خصوصیات راه رفتن انسان

اگر همه حرکات در راه رفتن را در نظر بگیریم، راه رفتن هر شخص منحصرب هفرد است. در مجموع، به نظر میرسد که راه رفتن ۲۰ جزء مختلف دارد، که برخی از آ نها را فقط میتوان از تصاویر گرفته شده از منظر بالای سر فرد موردنظر، انداز ه گیری کرد.

چرخش لگن و قفسه سینه در نمونه های مختلف بسیار متفاو ت اند بسیار مشکل هستند و به این علت برای بسیاری از کاربردهای عملی، مناسب نیستند. او همچنین ادعا میکند که این الگوهای چرخش برای یک فرد خاص در نمونه برداریهای متفاوت یکسان و سازگار نیستند. بنابراین برای سیستم  های بیومتریکی مبتنی بر بینایی کامپیوتری خودکار نیز چندان مناسب به نظر نمیرسند.

در چرخش مچ پا، ضربات لگن ۲ و جابه جایی های مکانی بالاتنه  (نوسانات عمودی، نوسانات جانبی و جاب هیجایی رو به جلو) در نمونه برداریهای متفاوت از یک شخص، دارای سازگاری هستند. به طور طبیعی، با توجه به دقت تفکیک اکثر دوربین های هم همنظوره، استخراج مچ پا به طور سازگار و با ثبات، کار مشکلی است. همچنین لگن نیز در بسیاری موارد ممکن است بر اثر پوشش، غیر قابل دید باشد و بنابراین اندازه گیری شیب آن با خطا انجام میشود.

جابه جایی بالاتنه از گردن به پایین اندازه گیری میشود. بنابراین  استخراج این جابه جایی نیز به علت مشکل پیدا کردن گردن به طور سازگار و به علت این حقیقت که گردن نیز مانند لگن ممکن است زیر لباس قرار بگیرد و قابل تشخیص نباشد، به راحتی و بدون خطا امکانپذیر نیست. به علت مشکل بودن استخراج این اجزا، این روش نیز برای سیستم های خودکار مناسب نیست.

از آنجایی که تعداد زیادی از ویژگ یهایی که با استفاده از اطلاعات پزشکی به وجود آمده اند برای سیستم های مبتنی بر بینایی کامپیوتری، مناسب به نظر نمیرسند، اجزای مورد بررسی در بسیاری از مقالات و تحقیقها به الگوهای چرخش لگن، زانو و مچ پا محدود شده اند.

تجزیه و تحلیل بصری حرکات انسان، امروزه یکی از مهم ترین و فعالترین موضوعات تحقیق در بینایی ماشین است. هدف آن تشخیص، ردگیری و شناسایی انسا نهاست. یا به طور کلی تر از آن  یتوان به عنوان ادراک رفتار انسان، از روی توالی تصاویر آن شخص، یاد کرد. هدف ردگیری انسان (کاری نسبتا مشکل اما مهم در تجزیه و تحلیل حرکت انسان ) بازیابی موقعیت شخص و زوایای اعضای به هم متصل، به طور پیوسته در توالی داده شده است.

نتایج حاصل از ردگیری میتواند در کاربردهای بسیار زیادی به کار گرفته شود. به عنوان مثال واقعیت مجازی، تجزیه و تحلیل عملکرد ورزشی و آموزش ورزشکار، مطالعات بالینی بیماران ارتوپدیک، محیط های احیا شده توسط کامپیوتر، سیستمهای نظارتی هوشمند، رابط کاربر مبتنی بر اشاره و چندین کاربرد دیگر.

همانطوری که اشاره شد، ردگیری انسان در توالی ویدئویی کاری نسبتا مشکل است. این مشکلات را میتوان به دو دسته تقسیم کرد،   نوع داخلی و نوع خارجی

 نوع داخلی از ساختار پیچیده و غیر صلب بدن انسان ناشی می شود. بدن اجزای بسیار زیاد متصل ب ههمی دارد که هر یک میتواند آزادانه مدلی یکپارچه برای ردگیری و شناسایی هویت انسان از روی نحوه راه رفتن اطراف محل اتصال خود حرکت کند. بنابراین حرکت انسان شامل درجات آزادی زیادی می باشد که خود منجر به هم پوشانی مکرر اعضای بدن با یکدیگر میشود. نوع خارجی، از حسگرها، لباس و پس زمینه ناشی میشود. حسگرهای دارای نویز و پس زمینه نابهنجار یا در حال تغییر، این گونه مشکلات را رقم می زنند. به همین دلیل در همه کارهای کسری محدودیت ها در نحوه تصویربرداری و شرایط محیط در نظر گرفته می شود.

نتایج حاصل از عملیات ردگیری که شامل موقعیت، جهت (Orientation) و زوایای اتصال  در هر فریم ویدئویی است، می توانند برای تشخیص هویت انسان مورد استفاده قرار گیرند.

خصوصیات بسیار زیادی در مدل گام برداشتن وجود دارد که میتوانند به عنوان ویژگی های تشخیص ب هکار روند. این خصوصیات را می توان به ویژگی های پویا و ویژگی های ایستا تقسیم کرد. ویژگی های ایستا شامل موارد مرتبط با معیارهای مبتنی بر هندسه بدن مانند ارتفاع یا ساختار آن است و ویژگی های پویا خط سیر زوایای اتصال پایین تنه می باشند. در بیشتر کارهای پیشین برای تشخیص هویت انسان از روی راه رفتن از اطلاعات سطح پایین مانند نیم مرخ استفاده کرد ه اند و در موارد کمی از اطلاعات سطح بالاتر مانند ویژگی های زمانی زوایای اتصال استفاده شده است. این ویژگی های پویا خصوصیات دینامیک گام برداشتن را بازتاب می نمایند.

در اینجا تحلیل و طراحی سیستمی است که با استفاده از تکنیک های بینایی، از روی نحوه گام برداشتن انسان ارتباطی بین ردگیری و تشخیص هویت وی ایجاد کند. در حقیقت ویژگی های پویای حرکت انسان را در توالی ویدئویی استخراج و در شناسایی یا تشخیص هویت از آن بهره ببریم.

برای ایجاد چنین مدل یکپارچ های برای ردگیری و شناسایی افراد از روی نحوه راه رفتن، از آنجای یکه باید از ویژگ یهای پویای راه رفتن بهره بگیریم،

از تکنیک های مبتنی بر مدل استفاده میکنیم. به این ترتیب که از روشی مبتنی بر مدل برای عملیات ردگیری استفاده کرده و سپس از ویژگی های استخرا ج شده در حین ردگیری برای شناسایی افراد بهره می گیریم. از این نمونه میتوان به مدلی یکپارچه برای ردگیری و شناسایی هویت انسان از روی نحوه راه رفتن اشاره کرد.

 اما برای  به دست آوردن نتایج مناسب شناسایی باید مدل مقاوم و مناسبی از بدن انسان استخراج نمود. نکته مهم دیگر اینکه اکثر رو شهای شناسایی انسان از روی نحوه راه رفتن چه مبتنی بر مدل و چه مبتنی بر نیمرخ محدودیت های متفاوتی در سیستمهای خود اعمال میکنند، از جمله این محدودیت ها میتوان به جهت حرکت و عدم هم پوشانی شخص در حال حرکت   در تصویر با اکثر این سیستم ها فرض میکنند فرد در مقابل دوربین موازی صفحه تصویر در حال حرکت می باشد.برای از بین بردن این محدودیت ها باید مدلی کامل در اختیار داشت تا به کمک آن مشکلات و نقایص روشهای پیشین را از بین ببریم.

برای استخراج چنین مدلی که تمام اطلاعات لازم بدن انسان را در بر داشته باشد برای هدف مقاوم و قابل اعتماد بودن مدل در برابر مشکلات مرتبط با جهت حرکت یا ه مپوشانی یک روش مناسب برای ردگیری مورد نیاز است. روش ردگیری پیشنهادی از اطلاعات مرزی و ناحی های به طور همزمان برای تطابق مدل روی بدن در هر فریم استفاده م یکند. پس از ردگیری مبتنی بر مدل شخص در دنباله تصاویر ویدئویی( دو بعدی و با استفاده از یک دوربین)، مدل شخص در حال راه رفتن در هر فریم را در اختیار خواهیم داشت. این روش طوری طراحی شده است که مستقل از جهت حرکت شخص در توالی ویدئویی باشد، با این شرط که با زاوی های دلخواه نسبت به دوربین روی خط مستقیم حرکت  میکند. وقتی شخص در جهتی غیر از موازی صفحه دوربین در حال حرکت باشد، زوایا و پارامترهایی که از دید دوربین دیده میشوند واقعی نیستند.

بنابراین در الگوریتم حاضر با استفاده از دانش تولید تصاویر (Projection)و دانش راه رفتن انسان، برای شخص در هر فریم مدلی  سه بعدی که خصوصیات حرکت را به خوبی توصیف کند، تولید  می شود. در این زمینه نیز کارهایی انجام شده است. در اکثر کارهای انجام شده در این زمینه کار بر روی یک تک تصویر انجام میشود و در برخی، بخشی از الگوریتم  )به عنوان مثال پیدا کردن مکان مفصلها ( به صورت دستی انجام میشود.

پس از برازش مدلی سه بعدی برای شخص در هر فریم، میتوان پارامترهای مورد نیاز برای شناسایی شخص را استخراج نمود و با استفاده از روشهای کلاس بندی و الگوریتم های یادگیری سیستم را آموزش داده و از آن بهره گرفت. در توالی تصاویر ویدئویی مورد استفاده فرض بر این است که پاها قابل مشاهده هستند،به عنوان مثال توسط دامن یا پالتو پوشانده نشد ه اند.

 

رو شهای تشخیص هویت از روی راه رفتن

روشهای زیادی برای تشخیص هویت افراد از روی راه رفتن در تصاویر ویدیویی ارائه شد هاند که م یتوان آ نها را به دو دسته کلی طبقه بندی کرد:

رهیافت های آماری و رهیافت های مبتنی بر مدل،رهیا فت های ارائه شده شامل سه فاز کلی هستند:

  • پیش پردازش
  • استخراج ویژگی
  • تشخیص

 

پیش پردازش

در فاز پیش پردازش معمولا یک الگوریتم حذف زمینه ساده صورت می پذیرد. مشهورترین روش برای تقطیع حرکت، تفاضل پس زمینه است، مخصوصا برای مواقعی که پس زمینه ثابت می یاشد. در این روش نواحی متحرک با تفریق کردن تصویر از تصویر زمینه مشخص می گردد. در این روش پس از تفاضل پس زمینه، برای ب هدست آوردن نواحی متحرک باید تصویر حاصل از تفریق را با استفاده از حدآستان های به تصویر دو دویی تبدیل نمود.

در جداسازی پ سزمینه، پس از ایجاد مدل پ سزمینه باید مدل ایجاد شده در طول زمان ب هروزرسانی گردد. اما فاکتورهایی مثل تغییرات نور، سایه ها و تکان خوردن شاخه ها، مشکلات زیادی را برای ایجاد و به روزرسانی تصاویرزمینه به وجود می آورد. الگوریتم های زیادی برای مدل کردن زمینه و حل این مشکلات وجود دارد، مثل میانگین زمانی دنباله تصاویر، فیلتر کالمن، تخمین گاوسی تطبیقی و رو شهای آماری و...

 

مروری بر رو شهای جداسازی پس زمینه

۱-میانگین زمانی دنباله تصاویر

در این روش میانگین فری مهای متوالی در طول زمانی محدود مشخصو به عنوان تصویر زمینه درنظر گرفته میشود. سپس قدرمطلق تفریق تصویر هر فریم از آن محاسبه و با یک مقدار آستانه، آستانه گیری میشود و نواحی حرکت استخراج میگردند. روش میانگین زمانی دنباله تصاویر بسیار سریع است و برای استفاده در محیط های بسته نتیجه خوبی به دست میدهد، اما نسبت به تغییرات نور، نویز و حرک تهای جزئی در محیطهای باز مثل حرکت برگ درختان بسیار حساس است و نمی تواند تغییرات پس زمینه محیط های باز را به خوبی مدل کند.

 

۲-فیلتر کالمن

در برخی موارد از فیلتر کالمن برای مدل کردن پیکسل های پس زمینه استفاده شده است. در روش فیلتر کالمن فرض می شود که بهترین اطلاعات حالت سیستم تخمین زده شود. فیلتر کالمن یک حالت جدید سیستم را پیشگویی میکند، پیشگویی را با مقدار واقعی اندازه گیری شده مقایسه می کند

و اختلاف پیشگویی و مقدار اندازه گیری شده را  وزن دهی میکند، و تخمینی جدید به دست می آورد. بنابراین به مقادیر اندازه گیری شده که با رفتار سیستم واقعی متناسب نیستند، وزن کمتری داده میشود. الگوریتم فیلتر کالمن بازگشتی است، یعنی تخمین شامل تمام اطلاعات سیستم درباره گذشته است ، بدون اینکه همه مقادیر اندازه گیری شده ذخیره گردد.

 

۳-مدل گاوسی تطبیقی ۶

در این روش یک مدل گاوسی برای هر پیکسل پ سزمینه تخمین زده می شود. میانگین و واریانس بردار ویژگی هر پیکسل، در یک دوره زمانی محاسبه میشود. پس اگر فاصله بردار ویژگی هر پیکسل از بردار میانگین کوچکتر از ضریبی از ریشه دوم واریانس باشد، پیکسل مربوطه به عنوان پیکسل پس زمینه در نظر گرفته میشود. در غیر اینصورت پیکسل مربوطه متعلق به شیء متحرک است. بردار میانگین و واریانس هر پیکسل زمینه در طول زمان به روزرسانی میگردند.

۴-مدل گاوسی مخلوط ۷

در این روش از چند تابع گاوسی برای تخمین توزیع مقدار هر پیکسل استفاده میشود.

۵- مدل کردن پس زمینه با مقادیر کمینه و بیشینه

زمینه صحنه با ارائه هر پیکسل به وسیله سه مقدار: کمینه و بیشینه مقدار روشنایی آن و بیشترین میزان اختلاف مقادیر روشنایی در دنباله فریم های مشاهده شده مورد توجه قرار میگیرد.

 

 

بانک اطلاعات مشاغل مجموعه