You can edit almost every page by Creating an account. Otherwise, see the FAQ.

Levenstein coding

מתוך EverybodyWiki Bios & Wiki
קפיצה אל:ניווט, חיפוש

קובץ:Levenshtein distance.svg
איור מרחק לבנשטיין

תרמיז לבנשטיין הוא קוד אוניברסלי המשמש בתורת המידע ובביואינפורמטיקה. תרמיז זה קרוי על שמו של ולדימיר לבנשטיין, מתמטיקאי רוסי שפיתח את הרעיון בשנת 1966. תרמיז לבנשטיין משמש לקידוד מחרוזות תוך מינימום שגיאות ומשמש בתחומים רבים כגון תקשורת נתונים, עיבוד שפה טבעית וביואינפורמטיקה.

תיאור[עריכה]

תרמיז לבנשטיין הוא שיטה לקידוד מחרוזות כך שניתן יהיה לשחזר את המחרוזת המקורית גם אם חלק מהנתונים אבדו או השתבשו. הקוד מבוסס על מרחק לבנשטיין, מדד להשוואה בין שתי מחרוזות המודד את מינימום הפעולות הדרושות כדי להמיר את אחת המחרוזות לשנייה. פעולות אלו יכולות להיות הוספה, הסרה או החלפה של תו.

הקוד משמש בתחומים שונים כגון:

  • תקשורת נתונים: לשיפור אמינות העברת הנתונים ותיקון שגיאות.
  • עיבוד שפה טבעית: לזיהוי ותיקון שגיאות כתיב.
  • ביואינפורמטיקה: להשוואה בין רצפי DNA וחלבונים.

יישומים[עריכה]

תרמיז לבנשטיין משמש במגוון יישומים מעשיים:

  • תקשורת נתונים: ברשתות תקשורת, הקוד משמש לתיקון שגיאות במידע המועבר בין נקודות שונות.
  • עיבוד שפה טבעית: במערכות לזיהוי כתיב תקלית, הקוד משמש לזיהוי ותיקון שגיאות כתיב.
  • ביואינפורמטיקה: במחקרים גנטיים, הקוד משמש להשוואה בין רצפי DNA וחלבונים כדי לזהות דמיון בין רצפים שונים.

ראו גם[עריכה]



Read or create/edit this page in another language[עריכה]