- آخرین فایل ها
- پرفروشترین فایل ها
- پربازدیدترین فایل ها
فایل ورد قابل ویرایش
طراحي و پياده سازي سيستمي براي بازشناسي كلمات دستنويس فارسي با حروف گسسته و لغتنامة معين با استفاده از يك شبكة عصبي سلسله مراتبي
چكيده
در اين مقاله، سيستمي براي بازشناسي نوشتار دستنويس فارسي ارائه شده است كه در اكثر مجموعه هايي كه با جمعآوري عمومي اطلاعات سروكار دارند، كاربرد دارد. هدف از اين پژوهش، بازشناسي كلمات دستنويسي است كه با حروف گسسته نوشته شدهاند. ويژگيهاي مورد استفاده در اين پژوهش، ويژگيهاي آماري حروف جداسازي شده است. شناسايي هر حرف توسط مجموعهاي از شبكههاي عصبي است كه بهصورت سلسلهمراتبي به هم متصل شدهاند. تقسيمبندي حروف به گروهبندي مناسب براي تقسيم بهينة عمليات شناسايي بين شبكههاي عصبي پياده سازي شده از ويژگيهاي اين پژوهش است و آناليز زباني انجام شده نيز براي كاهش احتمال خطا بر مبناي اطلاعات گروهبندي و با استفاده از لغتنامة اسامي اول 117000 نفر انجام شده است. آزمونهاي انجام شده بر روي دستخط 200 نفر نشاندهندة درصد بازشناسي متوسط %77.2 براي شناسايي حروف گسسته و %84.4 براي شناسايي كلمات لغتنامه است.
1- مقدمه
در دو دهة گذشته، فعاليت وسيعي براي استفاده از كامپيوتر در خواندن متنهاي دستنويس انجام شده است [1] – [4] . اگرچه با رشد و توسعة علوم انفورماتيك، حجم اطلاعات غير كاغذي افزايش يافته، اما هنوز در عمل اطلاعات كاغذي سهم خود را در مجموعة اطلاعات از دست نداده است. علاوه بر آن تبديل اطلاعات قبلي (كه عمدتاً روي كاغذ ثبت شدهاند) به اطلاعات كامپيوتري، قدم مهمي در راه اتوماسيون سيستمهاي اداري بهشمار ميرود. از طرف ديگر هنوز اطلاعات حجيمي وجود دارد (مانند انواع آزمونها، پرسشنامهها و … ) كه توسط افراد عادي ارائه ميشود و اپراتور بايد آنها را به كامپيوتر وارد كند و در بيشتر مواقع سيستمهاي OCR، حلقة گمشده اين زنجير به شمار ميرود.
در خط عربي و فارسي نيز تلاشهاي بسياري براي طراحي و پياده سازي سيستمهاي OCR انجام شده است كه اكثر اين سيستمها يا بر خواندن متنهاي تايپ شده متمركز شدهاند و يا توجه اصلي خود را به تقطيع حروف پيوسته به هم (كه يكي از مسايل اصلي تشخيص دستخط به شمار ميرود) معطوف كردهاند[5] – [7]. اين پژوهش بررسي حالتي از OCR را به عهده داشته است كه در عين سادهسازي مساله، ميتوانند مشكل ورود اطلاعات بسياري از محيطهاي اداري را مرتفع سازد. هدف از اين سيستم بازشناسي حروف گسستة فارسي است كه در تشخيص كلمهاي از يك لغتنامة معين مورد استفاده واقع ميشود. با توجه به اينكه اين سيستم، نياز به بازشناسي دنباله پيوستة حروف ندارد، در مورد حروف دستنويس دقت بازشناسي بالايي دارد و با توجه به وجود لغتنامة معين، با استفاده از آناليز زباني مناسب انجام شده، خطاي بازشناسي تا حدي كاهش يافته است كه استفاده از اين سيستم را در موارد كاربردي عملي ساخته است.
به طور خلاصه، مراحل انجام شده در اين پژوهش به اين شرح است، ابتدا بانك اطلاعاتي وسيعي از دستخطهاي مختلف تهيه شده است كه فرمهايي را با حروف منقطع پركردهاند. همچنين بانك اطلاعاتي مناسبي نيز براي لغتنامة موردنياز تهيه شده كه در اين مورد اسامي اول (مرد و زن) شركتكننده در يك آزمون ورودي بزرگ مورد استفاده قرارگرفته است. سپس بانك اطلاعاتي كلمات، براي آموزش و تست يك شبكة عصبي سلسله مراتبي به كار برده شده و يك الگوريتم آناليز زباني آماري نيز براي تصحيح خطاهاي سيستم بازشناسي حروف از روي لغتنامه تهيه شده است. براي تصحيح اشتباههاي احتمالي در هر دو بانك اطلاعاتي، هردو به شكل دستي كنترل و پالايش شدهاند.نمونهاي از حرفهاي ورودي در شكل 1 آمده است.
حجم:7005KB | بازدید :1291
فایل ورد قابل ویرایش توضیحی مختصر از متن فایل : مقدمه: اصولاً امروزه شهركهاي صنعتي بستر و شالوده رشد و ايجاد صنايع كوچك را فراهم مي كند. سازمان صنايع كوچك و شهركهاي صنعتي ايران هم به ايجاد روبناها مي پردازد و نواحي ، شهركها و مدلهاي مختلف توسعه اقتصادي نظير خوشه...
حجم:4886KB | بازدید :1619
فایل ورد قابل ویرایش توضیحی مختصر از متن فایل : طرح مقدماتی کارخانه تولید طناب نایلونی هر شرکت تولیدی از سه بخش کلی تشکیل شده است که بترتیب زیر میباشند. 1- بخش اداری 2- بخش حقوقی 3- بخش فنی و تخصصی و ما در این مجموعه به توضیح...
مقاله بررسی سیستم فروش در شرکت کارتن مشهد
حجم:4013KB | بازدید :1077
فایل ورد قابل ویرایش توضیحی مختصر از متن فایل : تاریخچه: شرکت کارتن مشهد(سهامی عام) در تاریخ 7/3/1363 تحت شمارة 3333 در ادارة ثبت شهرستان مشهد به ثبت رسید و در مرداد ماه سال 1368 بهرهبرداری آزمایشی و از ابتدای سال 1369 بهرهبرداری عملی از آن با ظرفیت 20.000 تن ورق و کارتن در...
حجم:3511KB | بازدید :2108
فایل ورد قابل ویرایش توضیحی مختصر از متن فایل : منابع و عوامل توليد بخش كشاورزي منابع اقتصادي روستاهاي ايران عمدتا شامل ؛ کشاورزي( زراعت، باغداري، دامداري ، شکار و صيد ) صنايع (دستي، روستايي، خانگي و کارگاهي) خدمات (عمومي، حمل و نقل و ...) ، دادوستد و پيله وري و...
حجم:2462KB | بازدید :1560
فایل ورد قابل ویرایش توضیحی مختصر از متن فایل : اقتصاد روستايي اقتصاد روستايي شاخه اي از اقتصاد است که با اقتصاد کشاورزي وابستگي متقابل دارد و در کليت ، خود جزئي از اقتصاد ملي است. هر گونه تغييري در اقتصاد ملي باعث تغيير در اقتصاد روستايي خواهد شد. اقتصاد روستايي با...
دانلود مقاله کامل الگوريتم هاي مسير يابي
حجم:2131KB | بازدید :1411
فایل ورد قابل ویرایش 142 صفحه توضیحی مختصر از متن فایل : مقدمه الگوريتمهاي مسيريابي در هريك از سه قرم گذشته فناوري خاصي رونق داشته باشد قرن هجدهم زمان توسعه سيستم هاي مكانيكي بزرگ به همراه انقلاب صنعتي بود. قرن نوزدهم عصر موتور بخار بود. قرن بيستم زمان جمع آو...
مقاله گرم کردن آب با نیروی خورشیدی
حجم:959KB | بازدید :1300
تقريباً همه ي ما در زندگي روزمره به آب گرم شده توسط انرژي خورشيدي بر خورده ايم. تا به حال چند بار شيلنگ آب را باز كرده ايد و با آب بسيار داغ درون آن مواجه شده ايد؟ خورشيد بدون توجه به تمـايل شـما آب درون شيـلنگ را گـرم مي كند. سيستم هاي گرمكن آب خورشيدي غير فعال از قديمي ترين و...