การวิเคราะห์ประสิทธิภาพของอัลกอริทึมเนมแมทชิ่งสำหรับระบบสืบค้นข้อมูลท่องเที่ยว โดยใช้ F-Measure

Authors

  • จักรกฤษณ์ เสน่ห์ นมะหุต ภาควิชาวิทยาการคอมพิวเตอร์และเทคโนโลยีสารสนเทศ คณะวิทยาศาสตร์ มหาวิทยาลัยนเรศวร จังหวัดพิษณุโลก

Abstract

เมื่อนักท่องเที่ยวต้องการสืบค้นข้อมูลท่องเที่ยวส่วนมากจะทำการสืบค้นผ่านเสิร์ชเอนจินที่ได้รับความนิยมอย่างกูเกิ้ล  แต่ผลลัพธ์ที่ได้นั้น มีจำนวนมากอาจต้องเสียเวลาในการเข้าถึงข้อมูลจากหลายเว็บไซต์และผลลัพธ์ที่ได้อาจไม่ตรงกับความต้องการ อีกทั้งในบางเว็บไซต์นำเสนอข้อมูลบนเว็บไซต์ที่อาจมีการเขียนไม่ถูกต้องตามหลักภาษาอังกฤษก็จะทำให้ได้ผลของการสืบค้นไม่พบเว็บไซต์ที่เขียนไม่ถูกต้อง ดังนั้น ผู้วิจัยจึงได้ประยุกต์ใช้อัลกอริทึมเนมแมชชิ่งมาใช้ในระบบสืบค้นข้อมูลท่องเที่ยวเพื่อแก้ปัญหาในการกรองข้อมูลชื่อที่สามารถเขียนได้หลายรูปแบบหรือมีความคล้ายคลึงกันทั้ง คำพ้องรูป พ้องเสียง หรือสะกดผิดในภาษาอังกฤษ ทำให้ข้อมูลท่องเที่ยว เช่น ชื่อของสถานที่ หรือชื่อของจังหวัด ที่เ ขียนผิดถูกค้นพบ อีกทั้งยังได้ทำการวัดประสิทธิภาพของอัลกอริทึมเนมแมชชิ่ง โดยใช้ F-Measure ซึ่งจากผลการวิจัยพบว่า อัลกอริทึม Soudex  มีประสิทธิภาพดีทีสุดในการสืบค้นข้อมูลท่องเที่ยวที่สามารถช่วยในการแก้ไขปัญ หาการพิมพ์ผิดหรือไม่ถูกหลักภาษาอังกฤษซึ่งจะทำให้ไม่พลาดข้อมูลทีต้องการ

 

Performance Analysis of Name Matching Algorithm for Tourist Information Searching System Using F-Measure

To extract tourism information, most travelers rely on web search engines such as Google, so they are faced with a huge number of web pages as results. Consequently, they apply a time consuming process accessing many websites but might still not get what they need. Moreover, if keywords or website contents are misspelled in English or other languages, the search results will consist of incomplete or incorrect information. To deal with these problems, name matching algorithms are used to make connections between several similar forms in English words, such as homographs and misspellings. This helps discover mistakes in tourist information, such as names of locations and administrative entities. In order to measure the performance of the name matching algorithms, F-Measure is used. The results show that the Soundex algorithm has the best performance in tourist information searching and can solve misspellings of information with names in English language effectively and will not miss any important tourist information.

Downloads

Issue

Section

บทความวิจัย (Research Article)