sigtrs vol 19 num 2

67
ענ קבוצת עלון י אחזור ין ו מידע טקסט- SIGTRS 1 . הענין מקבוצת חדשות/ דרורי עפר......................................... ...... .... . . ... 1 הקבוצה מפגשי: 2 . ישוםGSA דין פסקי במאגר- שמעוני גיורא.......................... ..... .... ... .... 5 3 . ארכיונים מחשוב- פלבינסקי מאיר........ ..... ................................. .. ....... 7 4 . של החיפוש מנועSQL - פרנקל אסף................................................. .... 14 5 . מידע כצרכני הכנסת חברי- דר' מרקוס רבקה................... .... ...... ....... . ... 28 מאמרים: 6 . חיפוש ארגוני, עגול שולחן מפגש סיכום- בודוגין ליזה........ ...... ...... ......... 31 7 . רחוק לטווח זכרון- כהן שגיא.................. ............................................ 50 עניינים תוכן8 . א לכרכים אינדקס' עד י ט' ) חוברת כולל2 ( עפ" מחברים י. ....... . ....... . ...... . . 52 9 . א לכרכים אינדקס' עד י ט' ) חוברת כולל2 ( עפ" כותרים י...... . . ......... . ... . ... 59 דצמבר2 201 י כרך ט' מספר2

Upload: offer-drori

Post on 31-Mar-2016

253 views

Category:

Documents


24 download

DESCRIPTION

עלון קבוצת עניין אחזור מידע וטקסט כרך 19 חוברת 2

TRANSCRIPT

Page 1: sigtrs vol 19 num 2

SIGTRS -טקסט מידע וין אחזור יעלון קבוצת ענ 1........................................................עפר דרורי/ חדשות מקבוצת הענין .1 :מפגשי הקבוצה

5..........................................גיורא שמעוני - במאגר פסקי דין GSAישום .2 7.......................................................מאיר פלבינסקי -מחשוב ארכיונים .3 14.....................................................אסף פרנקל - SQLמנוע החיפוש של .4 28........................................רבקה מרקוס' דר -חברי הכנסת כצרכני מידע .5

:מאמרים 31.............................ליזה בודוגין -סיכום מפגש שולחן עגול , ארגוני חיפוש .6 50..............................................................שגיא כהן -זכרון לטווח רחוק .7

תוכן עניינים

52.........................י מחברים"עפ) 2כולל חוברת (' טיעד ' אינדקס לכרכים א . 8 59.........................י כותרים"עפ) 2כולל חוברת (' טיעד ' אינדקס לכרכים א .9

2מספר ' טכרך י 2201 דצמבר

Page 2: sigtrs vol 19 num 2

חדשות מקבוצת הענין

__ __________________________________________

עפר דרורי

SIGTRS - Vol. 19 Num 2 - 12/2012 1

Page 3: sigtrs vol 19 num 2

ב"תשע בטבת 'יח 2012, בדצמבר 31

SIGTRS -טקסט ומידע קבוצת עניין אחזור עלון 2012 דצמבר - ' טיכרך 2חוברת

חדשות מקבוצת הענין

!לכולםשלום

אנו סוגרים גם את .הקבוצהשל ' טיאת כרך סוגרעלון זה . נוסףחדש אנו נפגשים שוב בעלון ...רעיונות לחגיגות העשרים יתקבלו בברכה. לקיום הקבוצה 19 - השנה ה

.עניין ופעילות ברוכה בתחום אחזור המידע, אני מאחל לכולנו המשך הנאה

והתאמנו את כרכי קבוצת העניין לשנה הקלנדרית " יישרנו קוו"הייתה שנה בה 2011שנת נמשיך כך בלי נדר בשנים . 2012הופיע כולו בשנת ' וכרך יט 2011ו בשנת הופיע כול' כך שכרך יח .הקרובות

י החברים עצמם בדפי המשוב בסיום "ראוי לציין שרוב הנושאים הנידונים בקבוצה נקבעים ע

.להציע נושאים לדיון וכמובן להציע את עצמכם להרצאהואתם מוזמנים להמשיך . המפגשים

באתר חומרים רבים שנאספו . www.sigtrs.orgת האתר של הקבוצה אני מזכיר לכם את כתובאנא הפיצו בין חבריכם את כתובתנו ועודדו אותם להצטרף לרשימת . במשך שנים רבות בתחום

).הרשימה מפוקחת על ידי והתעבורה בה נועדה לעדכונים בלבד(התפוצה קשר .1

)Mailing-list( באמצעות קבוצת דיוור אלקטרוניתקימת קשר עם חבריה הקבוצה מהדרכה .רשם לקבוצה או למחוק עצמו ממנהיהמאפשרת בצורה חופשית לכל אדם לה

רשימת תפוצה של "כיצד להצטרף או לעדכן כתובת מופיעה באתר תחת התפריט ".הקבוצה

ק מודפס של העלון צריכים לפנות ספריות וגופים מרכזיים אחרים המעוניינים לקבל עות

.ר הקבוצה"בבקשה מיוחדת ליו

שלה רשימת התפוצה האלקטרוניתלרשם ילהצריכים בקבוצה יםלהיות חברים רוצה .באתר הקבוצה

הדפיסו אותה לפני . שנועדה להקל על ההגעה של החברים מחוץ לעיראתר הקבוצה מפה ב

, 4כוונו אותו לרחוב פועלי צדק ) GPS(יני אם אתם עושים שימוש בניווט לוו. היציאה !נסיעה טובה. ירושלים

SIGTRS - Vol. 19 Num 2 - 12/2012 2

Page 4: sigtrs vol 19 num 2

מפגשים .2

.יםיפעמנפגשה הקבוצה 2012י נביו) 1. חוברת מס' טכרך י(מאז הוצאת הגיליון האחרון :במפגש נשמעו ההרצאות, 2012 ביוליהמפגש הראשון התקיים

י גיורא שמעוני"ע" במאגר פסקי דין GSAישום " .א GSA -בהרצאה הוצג השימוש של לשכת עורכי הדין במוצר החיפוש של גוגל

.לא מוכרים םתוך הדגמות מפורטות של פרמטרים שחלק מאיר פלבינסקיי "ע "מחשוב ארכיונים" .ב

הוצגו התהליכים . שבשימור חומר מקור לארכיוניםבהרצאה הומחשה החשיבות דה בתקנים שונים כדי לשמור על חומר עמי, הכנתו לצילום, קבלת חומר המקורמ

הבעיה המרכזית היום היא . בסופו של תהליך מתבצע שימור לחומר. המקור ועוד .כיצד לשמור ועל איזו מדיה כאשר הטכנולוגיה משתנה כל כמה שנים

:ותהבא ותההרצא ובמפגש נשמע, 2012 באוקטוברהמפגש השני התקיים י אסף פרנקל"ע SQLמנוע החיפוש של .א

שר פוינט ועוד וזאת , תכונת החיפוש שימושית להרבה מוצרים כמו אוטלוק .Bingבנוסף לחיפוש נקודתי של מנוע חפוש מול מאגר פיתוח כמו לא יהיה ) כמו מסמכים(מבחינת ארכיטקטורה נכון שהחומר המיועד לחיפוש טיפול , דטה- ת מטהשלו מוגבלת כמו בהוספ תבבסיס נתונים שהפונקציונאליו הנכון הוא לשמור מסמכים במערכות ניהול מסמכים עם כל . באבטחה ועוד יש חשיבות לבחירת . המורכבות שלהם ולאפשר ביצוע חיפוש גם בסביבה זו .שיטת החיפוש וסדרה כדי לקבל תוצאות טובות בזמני תגובה סבירים שים שונים באמצעות וניתנה הדגמה לאתר המבצע חיפו FTSהוצגו רכיבים של .המוצר

רבקה מרקוס' י דר"חברי הכנסת כצרכני מידע ע .ב

כלומר בדיקת הציטוטים ובמקרה של , ישיטת המחקר היא מחקר ביבליומטר .הכנסת ציטוטים בנאומים של חברי הכנסת המחקר כלל ביצוע אנליזה סטטיסטית מתוך דברי הכנסת הכוללים תמלול של תקופות בתולדות הכנסת 3נבדקו , 1043כל הנאומים שנבדקו סך. כל הנאומים לא נמצא הבדל סטטיסטי מובהק . 2007 -ומסתימות ב 1949 - המתחילות ב .בשיעור ציטוטי המקורות בכנסות השונות .פירוט הממצאים במצגת ובמאמר

מאמרים ועבודות .3

מאמרים 2בחוברת הפעם ליזה בודוגין -שולחן עגול סיכום מפגש, חיפוש ארגוני - שגיא כהן -זכרון לטווח רחוק -

אני מנצל סעיף זה בבקשה לקבלת עבודות או דוחות שונים שבוצעו במסגרות שונות העוסקות בנושאי הענין של הקבוצה לצורך פרסומם וכמובן ) 'אוניברסיטה וכו, עבודה( .רי עטו בנושאי הקבוצהלשלוח מאמר מפ םאני מעודד את כל אחד ואחת מכ

.קריאה מהנה

SIGTRS - Vol. 19 Num 2 - 12/2012 3

Page 5: sigtrs vol 19 num 2

חסות .4

.נכון להיום הקבוצה ללא חסות .נשמח לקבל הצעות לחסות מארגונים בתחום העיסוק של הקבוצה

כללי .5

מהווה פורום לאנשי מקצוע העוסקים ) SIGTRS" (וטקסט מידעאחזור "קבוצת הענין אנשי המקצוע הם מפתחים .טכנולוגיות קשורותו מידעאחזור , אחזור טקסטבתחום

.או משתמשים/ו) מנתחי מערכות ותוכניתנים(הרצאות י החתום מטה ומאז פועלת ברציפות הן במפגשי"ע 1994הקבוצה הוקמה בשנת

.והן בהפצת מידע בין היתר באמצעות עלון הקבוצה .פעמים בשנה להרצאות ולהחלפת רעיונות ארבעהקבוצה נפגשת כל חומר העלון בטקסט מלא . 1994עלון הקבוצה יוצא פעמים בשנה בקביעות משנת

.נמצא באתר הקבוצה :ר הקבוצה"רעיונות או חומר כתוב אחר ניתן לשלוח ליו, הצעות להרצאות

עפר דרורי ם"שע 91103ירושלים , 10414. ד.ת

02-5688714 : פקס 02-5688439 : טל

...)הכי טוב( [email protected]י או בדואר אלקטרונ

ב ב ר כ ה

עפר דרורי ר הקבוצה"יו

בקרו אותנו באתר הבית של הקבוצהhttp://www.sigtrs.org

SIGTRS - Vol. 19 Num 2 - 12/2012 4

Page 6: sigtrs vol 19 num 2

במאגר פסקי דין GSAישום

___________________________________________________

גיורא שמעוני

SIGTRS - Vol. 19 Num 2 - 12/2012 5

Page 7: sigtrs vol 19 num 2

במאגר פסקי דין GSAיישום

גיורא שמעוני

חיפוש באינטרנט הוא פעולה אותה אנו מבצעים על בסיס יומיומי. נהיגה במכונית היא גם כן פעולה שרובינו מבצעים לעיתים תכופות. עכשיו נסו לדמיין שהמכונית בה אתם נוהגים יכולה לנסוע רק

בהילוך ראשון, ללא הילוכים גבוהים וללא הילוך אחורי.

שרובינו מבצעים כשאנחנו מחפשים באינטרנט. אנו לרוב משתמשים רק בחלק זה פחות או יותר מה קטן מאפשרויות החיפוש דבר שגורם לנו לבזבז זמן יקר על סקירת התוצאות.

בהרצאה נבין את עיקרי הפעולה של מנועי חיפוש. נעלה את הבעיות והאתגרים העומדים כיום בפני המנועים עובדים. מנועי החיפוש ונסקור כמה מהשיטות על פי

של SQLתוך חיפוש GSAלאחר מכן נציג את מנוע פדאור גוגל לאחזור מידע משפטי הכולל שילוב של שדות המותאמים לעולם המשפט בישראל.

בהדגמה נעבור על כמה מכללי החיפוש הישימים למנועי גוגל, תחבירי שאילתות, תגיות נושאיות, ומורפולוגיה תוך שימוש בדוגמאות.

 

SIGTRS - Vol. 19 Num 2 - 12/2012 6

Page 8: sigtrs vol 19 num 2

מחשוב ארכיונים

________________________________________________________

מאיר פלבינסקי

SIGTRS - Vol. 19 Num 2 - 12/2012 7

Page 9: sigtrs vol 19 num 2

סריקה לצורך שימור ארכיוני

מאת מאיר פלבינסקי

שימור מסמכים, שימור ארכיוני הינו שימור המורשת שלנו לדורות הבאים.

מהו שימור? מהי ההגדרה של שימור?

 במילון וובסטר preservationהגדרת שימור או

1. the act or activity of keeping something in an existing and usually satisfactory 

condition.   

 פעולה או פעילות של שמירה על משהו במצב הקיים או מניח את הדעת

2. the careful maintaining and protection of something valuable especially in its 

natural or original state. 

שמירה והגנה קפדנית של משהו בעל ערך במיוחד במצבו הטבעי או המקורי.

שימור מסמכים לתקופת זמן. -שיטת המוצר הקיים

שימור ארכיוני שונה מסריקה רגילה:

שנים לצורך מס הכנסה. 7מסמכים בעלי אופי של הנה"ח נשמרים למשך

שנה. 100מסמכי היסטוריה רפואית ע"פ חוק יש לשמור

התרבות לדורות הבאיםשמירת 

שנה 200-300, בעבר לפני כבאיכות טובה הצבע והרזולוציה של מסמכים ארכיוניםשמירת אמצעי השמירה היה כדי חרס, הכניסו את המגילה לכד חרס והניחו אותו במקום יבש

-שימור חלקי כפי שנראה בתמונה הנ"ל -במדבר יהודה והתוצאה

   

SIGTRS - Vol. 19 Num 2 - 12/2012 8

Page 10: sigtrs vol 19 num 2

בק

יש שקף דק

השימוש בדב

ת שבכל דף

יתן לתיקון, ה

אלבום תמונות ועיות:

זק כבר לא נ

 

, אשנה 20ימש לא מקצ

ה שנים והנז

ר מודרני לפנוהתוצאות מ

רו לאחר כמ התמונות :

חשב לשימורועל התמונות

באלבום ניכם הרסו את ה

מוצר שנחמת ק שמוצמד ע

אות השימושמרים הכימים

לעומודביק

תוצאובחומ

SIGTRS - Vol. 19 Num 2 - 12/2012 9

Page 11: sigtrs vol 19 num 2

:המקצועי תהליכי השימור

המטרה שימור וגיבוי של חומר המקור לטווח ארוך.

: רבדיםהתהליך בנוי משלושה

הכנה ייצור שימור 

הכנה:

על מנת לבצע את פעולת השימור יש להכין את החומר באופן שניתן יהיה לראות את כל הנתונים בצורה קריאה וברורה.

קרועים, הפרדת סיכות מהדק.ההכנה כוללת :יישור , הדבקת חלקים

כל חומר מטופל באופן המתאים לדוגמא מגילה או מסמך מתפורר יש לפרוס וליישר בלי לפגוע במסמך על מנת שיתאפשר לצלמו אח"כ במקסימום האפשרי,

ספר כרוך מצולם כשהוא פתוח ובסדר המקורי, קיימות מצלמות מיוחדות שניתן לצלם ספר לא לפגום בכריכה ולגרום לה להתפרק.פתוח בחלקו בצורת ר כדי

:סוגי חומרים ואופן פריסתם לצורך צילום ושימור

SIGTRS - Vol. 19 Num 2 - 12/2012 10

Page 12: sigtrs vol 19 num 2

 

SIGTRS - Vol. 19 Num 2 - 12/2012 11

Page 13: sigtrs vol 19 num 2

ייצור:

את חומר המקור לא ניתן לחשוף לאור.

כולנו מכירים את ההוראה בכניסה למוזיאונים" אסור לצלם" מדוע? הבזק האור של המצלמה את ה"פלאש". הנזק לא נראה ן מבקשים לבטל גורם להרס התמונה ולירידת האיכות ולכ

בדומה להנחת ספר חשוף תחת השמש. באופן מיידי אלא לאחר כמה שנים.

בעת צילום החומר חשוב להקפיד:

 ., ללא חשיפה להבזק אורצילום בחדר חשוך •

אור קר (זהירות מפלש ומתאורה חמה) •

 ) דף זה הינו דף בקרה על איכות הצילום.דף טרגט (ראה דוגמא •

רק היא קטלנית!!!!!תאורה של סו •

רק צילום דיגיטלי דרך מצלמות ייעודיות ואיכותיות •

אין להעביר נייר דרך מסוע (של גלגלי שיניים או אחר) •

מ"מ במקרה של מיקרופילם 35 •

ביט צבע 24פורמט קובץ לא דחוס עם •

• PDF/A – לא דחוס פורמט ציבורי בקוד פתוח

דוגמא לדף טרגט:

SIGTRS - Vol. 19 Num 2 - 12/2012 12

Page 14: sigtrs vol 19 num 2

שימור:

נעשה ע"ג מיקרופילם או ע"ג מדיה דיגיטלית.השימור

סוג של פילם שעליו שומרים חומר ארכיוני, לאחר הצילום נעשה פיתוח עם - מיקרופילם קלטת המיקרופילם נשמרת בטמפרטורה קרירה יחסית ולאורך שנים.כימיקלים מיוחדים.

נושא זה עובר שידרוג משנה לשנה. - מדיה דיגיטלית

, היתרון בכך שהוא נגיש וזמין. אך כדאי היום להעביר את cd/DVDרמט הכיום מכירים את פו

למדיה עכשווית, ותמיד לשדרג על מנת לשמור על החומר. cd/DVDכל החומר הנמצא על

 :ההתמודדויות עם שמירת ארכיון לטווח ארוך

שימור ומניעת נזקים למקור •

גיבוי אמין, נגיש וארוך טווח •

פעם שהמדיה מתחלפת הסבה ממדיה למדיה בכל •

 מסקנות

ארכיון היסטורי הוא ארוך טווח בעוד שארכיון עסקי, כפי שמחייב החוק, הוא יחסית קצר טווח

אלא לאורך כל השנים בהמשך!!!! והטיפול בו שונה לחלוטין, לא רק בעת ההקמה,

 מי ששולט על ההווה שולט על ההיסטוריה....

ג'ורג' אורוול

SIGTRS - Vol. 19 Num 2 - 12/2012 13

Page 15: sigtrs vol 19 num 2

SQLמנוע החיפוש של

________________________________________________________

אסף פרנקל

SIGTRS - Vol. 19 Num 2 - 12/2012 14

Page 16: sigtrs vol 19 num 2

Full Text Search – מעבר צעד (beyond) למסד נתונים יחסי

אסף פרנקל

ארכיטקט בכיר

Microsoft Consulting Services ,[email protected] 

מוכרחים לצאת , שנה 30המשרתים את התעשיה כבר , מסדי נתונים יחסייםנתונים רבים היום הנם לא מובנים או . בנתונים יחסיים בלבדמהפרדיגמה של טיפול

-ביו, הקלטות, XML, כדוגמת מסמכים) unstructured and semi structured(חצי מובנים .אינפורמטיקה ועוד

יכולת זו , אבל. יכולת חיפוש הנה טכנולוגית מפתח לטיפול בסוגים שונים של מידע, מטבעם של דברים. וידידותית) אינדוקס ובחיפושב(מהירה , צריכה להיות סקלבילית

.מסד נתונים הנו מקום טבעי לשמור גם סוגי נתונים כאלו

SQL SERVER 2008החל משנת , אבל, 2000היה בעל יכולות חיפוש כבר משנת דבר זה מאפשר יכולת אינטגרטיבית של . יכולות אלו הינן חלק בלתי נפרד מהמנוע

.ם ונתונים לא מובנים בצורה מאוד יעילהבין נתונים יחסיי חיפוש

. המנוע אינו מיועד להיות מנוע חיפוש אוניברסלי לכל סוגי הבעיות, חשוב לציין יתרונו הגדול הנו בתחום שילוב הנתונים בו ניתן לחפש בקלות על מידע משולב

:סוגי שאילתות אופייניים

One or more specific words or phrases (simple term) A word or a phrase where the words begin with specified text (prefix

term) Inflectional forms of a specific word (generation term) A word or phrase close to another word or phrase (proximity term) Synonymous forms of a specific word (thesaurus) Words or phrases using weighted values (weighted term)

לתוצאות החיפוש המאפשרים בקלות מיון (rank)חשוב לציין כי המנוע נותן ציונים .לפי איכות

:להלן דוגמא הממחישה שאילתא אופינית

SIGTRS - Vol. 19 Num 2 - 12/2012 15

Page 17: sigtrs vol 19 num 2

 על ידי נשים 2012שהתפרסמו בשנת  SQLכל המאמרים הכוללים את המלה

:הסבר

חיפוש בתוכן המאמר למציאתSQL חיפוש בMetadata של המאמר למציאת השנה והמחברים חיפוש במאגר המחברים למציאת המגדר

כלי ניהול מלאים הכוללים גם מ נהנהמנגנון החיפוש , SQL Serverכחלק מהפלטפורמה של , מעבר לכך .גיבוי ושחזור ויכולות אופטימיזציה

בעברית אינה כלולה במוצר אך ניתנת לרישה מורפולוגיה . רבות כולל עבריתהמנוע כולל תמיכה בשפות . http://www.melingo.com/morfix_data.htm#sqlמחברה אחת לפחות

להלן לינק מרכז בו נמצאים רוב המאמרים החשובים בתחום us/library/hh393581.aspx‐http://technet.microsoft.com/en זאת כמובן בנוסף לתיעוד

 . us/library/ms142571.aspx‐oft.com/enhttp://msdn.micros המוצר הנמצא באינטרנט

SIGTRS - Vol. 19 Num 2 - 12/2012 16

Page 18: sigtrs vol 19 num 2

Understanding Full‐Text Indexing in SQL Server 

29 December 2008 by Robert Sheldon http://www.simple‐talk.com/sql/learn‐sql‐

server/understanding‐full‐text‐indexing‐in‐sql‐server/ 

Microsoft has quietly been improving full‐text indexing in SQL Server. It is time to take a good 

look at what it offers. Who better to give us that look than Robert Sheldon, in the first of a 

series. 

The most commonly used indexes in a SQL Server database are clustered and nonclustered 

indexes that are organized in a B‐tree structure. You can create these types of indexes on most 

columns in a table or a view, except those columns configured with large object (LOB) data types, 

such as text and varchar(max). Although this limitation is not a problem in many cases, there will 

be times when you’ll want to query such column types. However, without indexes defined on the 

columns, the query engine must perform a full table scan to locate the necessary data. But there 

is a solution—full‐text search. 

Full‐text search refers to the functionality in SQL Server that supports full‐text queries against 

character‐based data. These types of queries can include words and phrases as well as multiple 

forms of a word or phrase. To support full‐text queries, full‐text indexes must be implemented 

on the columns referenced in the query. The columns can be configured with character data 

types (such as char and varchar) or with binary data types (such as varbinary and image). A full‐

text index is made up of word tokens that are derived from the text being indexed. For example, 

if the indexed text contains the phrase “tables can include indexes,” the full‐text index would 

contain four tokens: “tables,” “can,” “include,” and “indexes.” Because the list of tokens can be 

easily searched, full‐text queries can quickly locate the necessary records. 

In this article, I explain how to implement full‐text indexing in your SQL Server 2005 or 2008 

database, and I provide a number of examples to demonstrate how this is done. For these 

examples, I used the following script to create and populate the ProductDocs table in the 

AdventureWorks2008 sample database in SQL Server 2008: 

CREATE TABLE ProductDocs (  

  DocID INT NOT NULL IDENTITY,  

  DocTitle NVARCHAR(50) NOT NULL,  

  DocFilename NVARCHAR(400) NOT NULL,  

  FileExtension NVARCHAR(8) NOT NULL,  

  DocSummary NVARCHAR(MAX) NULL,  

  DocContent VARBINARY(MAX) NULL,  

  CONSTRAINT [PK_ProductDocs_DocID] PRIMARY KEY CLUSTERED (DocID ASC)  

)  

GO  

INSERT INTO ProductDocs  

(DocTitle, DocFilename, FileExtension, DocSummary, DocContent)  

SELECT Title, FileName, FileExtension, DocumentSummary, Document  

FROM Production.Document  

 

SIGTRS - Vol. 19 Num 2 - 12/2012 17

Page 19: sigtrs vol 19 num 2

If you’re using the AdventureWorks sample database in SQL Server 2005, simply change the 

name of the database in the USE statement. 

1. To implement full‐text indexing in SQL Server, you should take the following steps: 

2. Create a full‐text catalog, if necessary.  

3. Create the full‐text index.  

4. Modify the list of noise words (SQL Server 2005) or stop words (SQL Server 2008), if 

necessary.  

5. Modify the thesaurus for the language being used, if necessary.  

These steps are the same in both SQL Server 2005 and 2008, although the specific features 

supported in each version differ. Part of that difference results from the fact that full‐text search 

is now integrated in the SQL Server 2008 database engine. Prior to 2008, full‐text search was 

based on the MSSearch engine, which sits outside SQL Server and is part of the Microsoft Office 

group. 

Creating the Full‐Text Catalog 

A full‐text catalog provides a mechanism for organizing full‐text indexes. Each catalog can 

contain zero or more indexes, but each index can be associated with only one catalog. Catalogs 

are implemented differently in SQL Server 2005 and 2008:  

SQL Server 2005: A full‐text catalog is a physical structure that must reside on the local hard 

drive associated with the SQL Server instance. Each catalog is part of a specific filegroup. If no 

filegroup is specified when the catalog is created, the default filegroup is used.  

SQL Server 2008: A full‐text catalog is a logical concept that refers to a group of full‐text indexes. 

The catalog is not associated with a filegroup.  

To create a full‐text catalog in either version of SQL Server, you can use the CREATE FULLTEXT 

CATALOG statement, as shown in the following example: 

USE AdventureWorks2008  

GO  

CREATE FULLTEXT CATALOG ProductFTS  

WITH ACCENT_SENSITIVITY = OFF 

Full‐text catalogs are associated with specific databases. In this case, I added the catalog to the 

AdventureWorks2008 database, but you can create the catalog on any user‐defined database.  

The only required clause in a CREATE FULLTEXT CATALOG statement is the CREATE FULLTEXT 

CATALOG clause, which requires that you provide a name for the catalog (in this case, 

ProductFTS). You can also specify whether this catalog is the default catalog, the catalog owner, 

or, as in the example above, whether the indexes in the catalog are accent sensitive or 

insensitive.  

If the WITH ACCENT_SENSITIVITY clause is not specified, accent sensitivity is based on the 

default database collation. You can determine a database’s collation by querying the 

sys.databases catalog view, as shown in the following example: 

SIGTRS - Vol. 19 Num 2 - 12/2012 18

Page 20: sigtrs vol 19 num 2

SELECT name, collation_name FROM sys.databases  

WHERE name = 'AdventureWorks2008' 

The follow table shows the statement’s results: 

Name  collation_name 

AdventureWorks2008  SQL_Latin1_General_CP1_CI_AS 

Note: The results shown above, along with the results shown for other examples in this article, 

are based on queries issued in SQL Server 2008 against the AdventureWorks2008 database. You 

results may be different depending on the SQL Server version and the database used. 

As mentioned above, SQL Server 2005 full‐text catalogs are part of a filegroup. If you’re running 

the CREATE FULLTEXT CATALOG statement against SQL Server 2005, you can specify the name of 

the filegroup by using the ON FILEGROUP option. You can also specify the directory on which to 

store the catalog by using the IN PATH option. Both of these options are ignored in SQL Server 

2008. For details about the ON FILEGROUP and IN PATH options, see the topic “CREATE FULLTEXT 

CATALOG (Transact‐SQL)” in SQL Server 2005 Books Online. 

After you create a full‐text catalog, you can use the sys.fulltext_catalogs catalog view to verify 

that the catalog has been created: 

SELECT fulltext_catalog_id, name FROM sys.fulltext_catalogs 

In this case, the statement returns the results shown in the following table: 

fulltext_catalog_id  name 

5  AW2008FullTextCatalog 

10  ProductFTS 

Notice that the ProductFTS full‐text catalog is included in the results. Also notice that in this case 

the fulltext_catalog_id value is 10. The ID is a good number to note because you can use it in 

other statements that are related to the full‐text catalog. 

Creating the Full‐Text Index 

After you create your full‐text catalog, you’re ready to create your full‐text index. You can then 

associate the index with the new catalog. If you don’t specify a catalog when you create the 

index, the index is associated with the database’s default catalog, whether it is the system 

catalog or a user‐defined catalog that has been configured as the default. 

A full‐text index is defined at the table level, and only one full‐text index can be defined per 

table. For a table to support a full‐text index, a unique index must be defined on that table. In 

addition, the index must be defined on a single column and be non‐nullable. This column is 

referred to as the key index in the full‐text index definition. For best performance, the key index 

should be defined on a column configured with an integer data type. Often, the primary key is a 

good candidate for a key index. 

SIGTRS - Vol. 19 Num 2 - 12/2012 19

Page 21: sigtrs vol 19 num 2

You can define a full‐text index by using the CREATE FULLTEXT INDEX statement, as shown in the 

following example. 

CREATE FULLTEXT INDEX ON ProductDocs  

(DocSummary, DocContent TYPE COLUMN FileExtension LANGUAGE 1033)  

KEY INDEX PK_ProductDocs_DocID  

ON ProductFTS  

WITH STOPLIST = SYSTEM 

The first line of the statement includes the ON clause, which specifies the table name (in this 

case, ProductDocs). The statement’s next line is a list of the columns that should be indexed 

(DocSummary and DocContent).  

Notice that the DocContent column definition includes the TYPE COLUMN clause and the 

LANGUAGE clause. The TYPE COLUMN clause is necessary when the indexed column stores 

binary data. The TYPE COLUMN clause specifies the name of a different column in the table that 

stores the file extension for the binary data. For example, the binary data might be a .doc file or 

.xls file. SQL Server uses the column specified in the TYPE COLUMN clause to associate the 

binary data with the program, such as Word or Excel. 

You can use the sys.fulltext_document_types catalog view to return a list of the document types 

supported by full‐text search, as shown in the following statement: 

SELECT document_type, version, manufacturer  

FROM sys.fulltext_document_types 

The following table provides a sample of some of the document types (indicated by their file 

extension) supported by full‐text search: 

document_type Version .ascx 12.0.6828.0 .asm 12.0.6828.0 .asp 12.0.6828.0 .aspx 12.0.6828.0 .bat 12.0.6828.0 .c 12.0.6828.0

.cmd 12.0.6828.0 .cpp 12.0.6828.0 .cxx 12.0.6828.0 .def 12.0.6828.0 .dic 12.0.6828.0 .doc 2006.0.6001.16503

 

The second clause in the DocContent column definition is LANGUAGE. For each column that you 

include in your index, you can specify the language of the documents in that column. You 

SIGTRS - Vol. 19 Num 2 - 12/2012 20

Page 22: sigtrs vol 19 num 2

reference the language by using the locale identifier (LCID). You can view a list of the identifiers 

and their associated languages by using the sys.fulltext_languages catalog view: 

SELECT * FROM sys.fulltext_languages  

ORDER BY lcid 

The following table shows a part of the result set. As you can see, 1033, the ID I use in the 

LANGUAGE clause, is English. 

lcid Name 0 Neutral

1025 Arabic 1026 Bulgarian 1027 Catalan 1028 Traditional Chinese 1031 German 1033 English 1036 French 1037 Hebrew 1039 Icelandic 1040 Italian

 

The next line of the CREATE FULLTEXT INDEX statement in the preceding example is the KEY 

INDEX clause. This is the name of the unique key index (in this case, PK_ProductDocs_DocID) 

that is defined on the ProductDocs table. Be sure to specify the index name, and not the column 

name, when defining your full‐text index. 

Following the KEY INDEX clause in the full‐text index definition is the ON clause, which specifies 

the name of the full‐text catalog (ProductFTS) that the index will join. In SQL Server 2008, you 

can also specify a filegroup where the index will be stored. However, this option isn’t available in 

SQL Server 2005 because filegroup association is at the catalog level. 

The final clause in the example CREATE FULLTEXT INDEX statement is WITH STOPLIST. This 

option, available only in SQL Server 2008, lets you specify the name of the stoplist that will be 

used for this index. In this case, the system stoplist is used, but you can instead specify a user‐

defined stoplist. (Stoplists are covered in more detail later in the article.) 

After you create a full‐text index on a table, you can use several catalog views to verify the index 

has been created and is associated with the correct catalog. The following SELECT statement 

joins the sys.tables, sys.fulltext_indexes, and sys.fulltext_catalogs views: 

SELECT t.name AS TableName, c.name AS FTCatalogName  

FROM sys.tables t JOIN sys.fulltext_indexes i  

  ON t.object_id = i.object_id  

JOIN sys.fulltext_catalogs c  

  ON i.fulltext_catalog_id = c.fulltext_catalog_id 

SIGTRS - Vol. 19 Num 2 - 12/2012 21

Page 23: sigtrs vol 19 num 2

As you can see in the following results, the ProductDocs table is associated with the ProductFTS 

catalog. Only tables with full‐text indexes are listed in the results. 

TableName  FTCatalogName 

ProductReview  AW2008FullTextCatalog 

Document  AW2008FullTextCatalog 

JobCandidate  AW2008FullTextCatalog 

ProductDocs  ProductFTS 

One of the advantages of SQL Server 2008 is that the index is now stored within the database. 

That means you can issue a query that lists the contents of the index, something you cannot do 

in SQL Server 2005. The following SELECT statement uses the sys.dm_fts_index_keywords 

dynamic management function to return the list of terms stored in the full‐text index created on 

the ProductDocs table: 

SELECT display_term, column_id, document_count  

FROM sys.dm_fts_index_keywords  

  (DB_ID('AdventureWorks2008'), OBJECT_ID('ProductDocs')) 

 

The results returned by the statement include the indexed terms, along with the column ID and 

document count (number of rows) that contain the term. The column ID is based on the order 

the columns are defined in the table definition. In the ProductDocs table, the two indexed 

columns are DocSummary (the fifth column defined) and DocContent (the sixth column defined). 

The following table shows the first 25 terms stored in the ProductDocs full‐text index. 

display_term column_id document_count 100 5 1 100 6 1

1000 6 1 150 6 1 16 6 2 20 6 1

2000 6 1 20w 6 1 23ft 6 1 248 6 1 250 6 1

3000 6 1 44 6 1 48 6 1 500 5 1 500 6 1 618 6 1 619 6 1 620 6 1

SIGTRS - Vol. 19 Num 2 - 12/2012 22

Page 24: sigtrs vol 19 num 2

Above 6 2 Absorbing 6 1 Acceptable 6 1 Accessories 6 1

Add 6 1 Adding 6 1

 

Modifying the List of Noise Words or Stop Words 

When implementing full‐text indexing in SQL Server, the area in which you will probably see the 

greatest differences between SQL Server 2005 and 2008 is in the way each version handles noise 

words or stop word. 

Noise Words in SQL Server 2005 

Noise words are those words that are automatically removed from a full‐text index when that 

index is created. For example, in the phrase “an apple and an orange,” the words “an” and “and” 

are considered noise words and are not be included in the index. Only “apple” and “orange” are 

tokenized and added to the index. 

SQL Server 2005 defines noise words in a set of text files, which by default, are stored in the 

folder $SQL_Server_Install_Path\Microsoft SQL Server\MSSQL.1\MSSQL\FTData. Each text file is 

associated with a specific language and contains the noise words associated in that language. For 

example, the English noise words are stored in the noiseENG.txt file. The following list shows a 

sample of some of the words in the file: 

About 1 after 2 all also 3 an 4

And 5 another 6 any 7 are 8 as

9 at 0 be $ because been before

Being between both but by came can

Come could did do

You can edit a noise word file in any text editor. Simply add or remove words as necessary, and 

then save your changes. (Be sure to save a copy of the original file before changing it.) 

Note: After you modify a noise word file, you must repopulate the applicable full‐text indexes for 

the changes to take effect. 

Stop Words in SQL Server 2008 

SQL Server 2008 uses stop words, not noise words. Stop words are saved to stoplists, which are 

stored within SQL Server. You can create a stoplist by using a CREATE FULLTEXT STOPLIST 

statement, as shown in the following example: 

SIGTRS - Vol. 19 Num 2 - 12/2012 23

Page 25: sigtrs vol 19 num 2

CREATE FULLTEXT STOPLIST ProductSL  

FROM SYSTEM STOPLIST;  

 

In the first line, the statement creates a stoplist named ProductSL. The second line retrieves the 

stop words from the system stoplist and uses those stop words to populate the new stoplist. You 

can verify that the stoplist has been created by querying the sys.fulltext_stoplists catalog view: 

SELECT stoplist_id, name FROM sys.fulltext_stoplists 

As you can see in the following results, the ProductSL stoplist has been added to the database, 

and the stoplist ID is 5. 

stoplist_id  Name 

5  ProductSL 

After you create a stoplist, you can view its contents by querying the sys.fulltext_stopwords 

catalog view, as shown in the following statement: 

SELECT stopword FROM sys.fulltext_stopwords  

WHERE stoplist_id = 5 AND language_id = 1033 

 

Notice that I specified the stoplist ID and language ID to retrieve only the necessary content. The 

following table shows a partial list of the stop words saved to the ProductSL stoplist. 

Stopword 

About  Be  come 

After  because  could 

All  been  Did 

Also  before  Do 

An  being  does 

And  between  each 

another  both  else 

Any  But  For 

Are  By  from 

As  came  Get 

At  Can    

 

In SQL Server 2008, you can add words to or remove words from a stoplist by using the ALTER 

FULLTEXT STOPLIST statement. The following statement adds the word “nuts” to the stoplist: 

ALTER FULLTEXT STOPLIST ProductSL  

ADD 'nuts' LANGUAGE 1033;  

 

When you generate a full‐text index based on this stoplist, any occurrence of “nuts” will be 

treated as a stop word and be removed from the index. 

SIGTRS - Vol. 19 Num 2 - 12/2012 24

Page 26: sigtrs vol 19 num 2

SQL Server 2008 also includes the sys.dm_fts_parser dynamic management function. The 

function lets you test how SQL Server will tokenize a string based on a specific language and 

stoplist. In the following SELECT statement, the function parses the phrase “testing for fruit and 

nuts, any type of nut.” 

SELECT special_term, display_term  

FROM sys.dm_fts_parser  

  (' "testing for fruit and nuts, any type of nut" ', 1033, 5, 0) 

 

The first argument in the function is the string that will be parsed, the second argument is the 

language ID, the third argument is the stoplist ID, and the fourth argument specifies whether the 

parsing should be accent insensitive (0) or accent sensitive (1). The following table shows the 

query results. Notice that “nuts” is considered a noise word. 

special_term  display_term 

Exact Match  Testing 

Noise Word  For 

Exact Match  Fruit 

Noise Word  And 

Noise Word  Nuts 

Noise Word  Any 

Exact Match  Type 

Noise Word  Of 

Exact Match  Nut 

If you want to drop “nuts” from the stoplist, you can use the following statement: 

ALTER FULLTEXT STOPLIST ProductSL  

DROP 'nuts' LANGUAGE 1033;  

 

Now when you use the sys.dm_fts_parser function to view the stoplist, you will receive the 

following results, which show that “nuts” is now considered an exact match. 

special_term  display_term 

Exact Match  Testing 

Noise Word  For 

Exact Match  Fruit 

Noise Word  And 

SIGTRS - Vol. 19 Num 2 - 12/2012 25

Page 27: sigtrs vol 19 num 2

Exact Match  Nuts 

Noise Word  Any 

Exact Match  Type 

Noise Word  Of 

Exact Match  Nut 

Earlier in the article, when I created the full‐text index on the ProductDocs table, I specified that 

the index should use the system stoplist. I can now modify the index definition to instead use the 

ProductSL index. In the following ALTER FULLTEXT INDEX statement, I set the stoplist to 

ProductSL: 

ALTER FULLTEXT INDEX ON ProductDocs  

SET STOPLIST ProductSL 

Note: After you modify a stoplist or full‐text index definition, you must repopulate the applicable 

full‐text indexes for the changes to take effect. 

Modifying the Full‐Text Thesaurus 

Both SQL Server 2005 and SQL Server 2008 provide a set of XML thesaurus files that let you 

define synonyms to support full‐text queries. For example, you can define a set of synonyms for 

“song,” “tune,” and “music.” That way, whenever a query is issued against any one of these 

terms, the results include every other term defined in the set. 

SQL Server includes a thesaurus file for each language supported by full‐text search. The files are 

named according to the language they support. For instance, the thesaurus file that supports 

English synonyms is named tseng.xml. 

In a default installation of SQL Server 2005, the thesaurus files are stored in the folder 

$SQL_Server_Install_Path\Microsoft SQL Server\MSSQL.1\MSSQL\FTData. In a default 

installation of SQL Server 2008, the files are stored in the folder 

$SQL_Server_Install_Path\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\FTData.  

Each thesaurus file comes preconfigured with the following XML code. For example, the 

following code is included in the tseng.xml file: 

<XML ID="Microsoft Search Thesaurus">

<!-- Commented out (SQL Server 2008)

<thesaurus xmlns="x-schema:tsSchema.xml">

<diacritics_sensitive>0</diacritics_sensitive>

<expansion>

<sub>Internet Explorer</sub>

<sub>IE</sub>

<sub>IE5</sub>

</expansion>

<replacement>

<pat>NT5</pat>

<pat>W2K</pat>

SIGTRS - Vol. 19 Num 2 - 12/2012 26

Page 28: sigtrs vol 19 num 2

<sub>Windows 2000</sub>

</replacement>

<expansion>

<sub>run</sub>

<sub>jog</sub>

</expansion>

</thesaurus>

-->

</XML>

As you can see, most of the code is commented out, but you can modify the file as necessary. 

The first element to note is <diacritics_sensitive>. This element determines whether the 

thesaurus file is accent sensitive (1) or insensitive (0). By default, a thesaurus file is accent 

insensitive. 

The other two elements worth noting are <expansion> and <replacement>. The first lets you 

define expansion sets, and the second lets you define replacement sets: 

Expansion set: A set of terms that can be substituted for each other. For example, in the sample 

<expansion> element in the tseng.xml file, three terms are included: “Internet Explorer,” “IE,” 

and “IE5.” As a result, if a full‐text query includes the term “Internet Explorer,” the query results 

can include content that contains any of the three terms.  

Replacement set: A set of terms in which one term is substituted for another. For example, in the 

example <replacement> element in the tseng.xml file, the terms “NT5” and “W2K” are replaced 

by “Windows 2000.” As a result, if a full‐text query includes the term “NT5” or “W2K,” the search 

results include only content that contains “Windows 2000.”  

You can edit a thesaurus file in any XML or text editor. After you save your changes, you must 

take steps to ensure that the thesaurus is applied to your full‐text searches. In SQL Server 2005, 

this means you must restart the full‐text search engine. However, in SQL Server 2008, you need 

only run the sys.sp_fulltext_load_thesaurus_file system stored procedure, as shown in the 

following example: 

EXEC sys.sp_fulltext_load_thesaurus_file 1033 

As you can see, when you run the stored procedure, you must specify the LCID. The stored 

procedure then parses and loads the data from the applicable thesaurus file, without having to 

restart the full‐text engine. 

Looking Ahead 

After you’ve implemented a full‐text index on a table, you can then query the indexed columns 

by using special predicates or functions. In my next article, I will explain how to create those 

queries and demonstrate the syntax that you use. Until then, you should now have the 

information you need to create your full‐text indexes. Remember that you can create only one 

full‐text index on a table or view and that you can create an index only on a table or view that is 

configured with a non‐nullable unique index (with only one key). Otherwise, the process of 

creating a full‐text index is very straightforward. For more details about full‐text indexing and 

full‐text search in general, be sure to check out SQL Server Books Online. 

SIGTRS - Vol. 19 Num 2 - 12/2012 27

Page 29: sigtrs vol 19 num 2

חברי הכנסת כצרכני מידע

__________________________________________________________

רבקה מרקוס' דר

SIGTRS - Vol. 19 Num 2 - 12/2012 28

Page 30: sigtrs vol 19 num 2

הרחבה להרצאה - חברי כנסת כצרכני מידע

בקה מרקוסר

כרוכות המערכת תפוקות כל. כמותו מאין מרכזי הוא הפרלמנטרית בפעילות המידע תפקיד

מרכיביו בין הפרלמנט בתוך המידע זרימת, כן על יתר. המחוקקים ידי על המידע בקליטת

התפקוד על הן המשפיעה היא, בפעילותו המעורבים האחרים הגורמים לבין וביניהם, השונים

. זו פעילות תוצאות על והן הפרלמנטרית והפעילות

ככל יותר יעיל יהיה ההחלטות קבלת שתהליך היא הבסיסית התיאורטית שההנחה לציין חשוב

. בהחלטותיהם משכיל שימוש בו ועושים האפשר ככל מגוון למידע חשופים ההחלטות שמקבלי

שימת תוך, שונים בהקשרים הכנסת חברי משתמשים בהם המידע מקורות על במחקר זה הצבענו

המגבירות הנסיבות ובין שימוש נעשה בו המידע סוג בין האפשריים הסיבתיים הקשרים על דגש

. ספציפיים מידע בסוגי לשימוש הנטייה את

הכנסת חברי של השימוש צורת את בבדיקתנו הביבליומטריה של בכלים, להשתמש בחרנו

זו ששיטה מוצאים אנו. שאלונים כגון אחרות מחקר שיטות על ולהעדיפה שונים מידע במקורות

.אחרות משיטות מהטיה פחות סובלת

שימוש .נעשתה נעשה בהם המידע סוגי את מאפיינת עסקנו בהם המשתנים של הליבה קבוצת

ובין מערכתיים-תוך משתנים בין הועדות עבודת חינתבוב המליאה עבודת בחינתב חלוקה

שימוש שבין בהבדל למשל המדובר המליאה עבודת של בהקשר. מערכתיים-חוץ משתנים

מידע מקורות על הצבענו ,כן כמו. ההמוניים התקשורת באמצעי שימוש ובין רשמיים במסמכים

.המליאה עבודת של בהקשר" אישיים" למקורות יש מכריע מקום אלה בין. נוספים

בו המידע סוג כי ברור. המידע מקורות של התיאורי בהקשרהתמקדנו לא זו עבודהה במסגרת

-בלתי' משתנים של קבוצות לשלוש לחלק ניתן אותם נוספים רבים במשתנים תלוי שימוש נעשה

(בכירות, פרלמנטרית,;הכנסת חברי את המאפיינים משתנים ;כרונולוגיים משתנים ':תלויים

סוג את המאפיינים משתנים ;מין ועוד' דת, ,קואליציהחברות ב ותק פרלמנטרי,

.הצעות לסדר היום ועוד') (שאילתות ,הצעות חוק,הפעילות

לבכירות נוגע המליאה בעבודת שימוש נעשה בהם המקורות לסוג הנוגע ביותר הבולט הממצא

הוא יותר בכיר הנואם שמעמד ככל, יהא אשר הבכירות תיבדק פיו על המשתנה יהא. הנואמים

רב יותר נמוך הנואם שמעמד שככל בעוד, מערכתיים- פנים במקורות יותר רב שימושל נוטה

.השימוש

עם קשרים וחסרי פארלמנטרי ניסיון חסרי, הצעירים הכנסת חברי מערכתיים-חוץ במקורות

דהיינו( הפוליטי בממסד המעורים כנסת חברי לעומת לתקשורת נזקקים, הפוליטי הממסד

מצינורות מידע משיגים) אחרים ציבוריים בתפקידים או, בממשלה תפקידים בעלי שהיו בכירים

. אלטרנטיביים

SIGTRS - Vol. 19 Num 2 - 12/2012 29

Page 31: sigtrs vol 19 num 2

. במליאה החקיקה בדיוני מערכתיים-תוך במקורות יותר הרב השימוש הוא אחר בולט ממצא

.השנים במהלך מערכתיים- חוץ במקורות השימוש לגידול נטייה ניכרת כן כמו

בשל היתר בין, כפרטים הכנסת חברי בין ההבדלים על לעמוד יותר קשה הועדות עבודת בבחינת

. הועדה לדיוני המוזמנים אופי על הדגש הושם כאן. החברים לשיעור המוזמנים שיעור בין ההבדל

: עיקריים סיווגים לחמישה אוחדו אלה. שונים סיווגים עשר לששה המוזמנים סווגו מלכתחילה

.מערכתיים-חוץ וגורמים, מומחים, משפטנים, כנסת אנשי, המבצעת הרשות אנשי

, משנה חקיקת, ראשית חקיקה: עיקריים פעילות סוגי ארבעה של סיווג נעשה הועדות בעבודת

הוא אך, בתקופה כאמור קשור המוזמנים מספר. אחרים ודיונים, היום לסדר בהצעות דיונים

. הדיונים בסוג גם קשור

וחקיקת הראשית החקיקה בפעילויות והמשפטנים המבצעת הרשות אנשי של הרב חלקם בולט

. הפעילויות כלל בבחינת מאוד רב מערכתיים-חוץ גורמים של חלקם. המשנה

מסגרת גורם, הזמן גורם – שבדקנו הגורמים סוגי שלושת השפעת כי ברור לעיל האמור מכל

יותר משפיע הזמן גורם, כך. אינטראקטיבי הוא האישיים הרקע מאפייני וגורם, וסוגה הפעילות

בעבודת בולט הרקע מאפייני גורם. הציטוטים הקף על לא אך, בוועדות המוזמנים הקף על

מספר את מגבירים ועדותוב החקיקה דיוני. הועדות בעבודת ביטוי לו משיש יותר המליאה

ואנשי משפטנים שהם למוזמנים באשר יותר בולט והדבר הזמן גורם כשמנוטרל אף המוזמנים

. המבצעת הרשות

 

SIGTRS - Vol. 19 Num 2 - 12/2012 30

Page 32: sigtrs vol 19 num 2

סיכום מפגש שולחן עגול, חיפוש ארגוני

_______________________________________________________

ליזה בודוגין

SIGTRS - Vol. 19 Num 2 - 12/2012 31

Page 33: sigtrs vol 19 num 2

סיכום מפגש שולחן עגול

חיפוש ארגוניבנושא

מנחת המפגש:

ליזה בודוגין

SIGTRS - Vol. 19 Num 2 - 12/2012 32

Page 34: sigtrs vol 19 num 2

,לקוחות נכבדים שלום רב

חיפוש ארגוני.בנושא )Round Table(אנו מודים למשתתפים במפגש השולחן העגול

.בסיכום זה מובאים עיקרי הדברים אשר עלו במהלך המפגש יחד עם תוצאות הסקר

לאחרונה התווספו מספר .הכלים הקיימים כיום בשוקמפת –דבר ראשון שעלה בדיון הינו שים למפת הפתרונות הקיימים בשוק.מוצרים חד

שאלות מרכזיות: מספרבמהלך הדיון הועלו

ארגונים יותר ויותר מרגישים את הלחץ לספק כלי שיקל על מציאת המידע בצורה מהירה

ויעילה. אנו רואים עניין הולך וגובר מלקוחותינו בכלים מסוג זה, אולם השאלות סביב הנושא

עדיין רבות.

נושאים הבאים:במסגרתו שוחחנו על השולחן עגול קיימנו לשם כך אנו

מהם הכלים שארגונים בוחנים? האם ללכת על כלי רחב וכולל או פתרונות –כלי חיפוש

נקודתיים וקטנים?

ם? האם לחפש בתוכן בלתי מהם מקורות המידע שכדאי לחבר את מנוע החיפוש אליה

?DWטואלי בלבד, או גם בתוכן מובנה במערכות התפעוליות/סמובנה/טק

שכזה?כיצד יש להיערך לפרויקט

האם הארגונים מוצאים את נושא המורפולוגיה כנושא חשוב?

חסוך" את מאמץ התיוג של התכנים?ל"האם חיפוש יכול

שאלהע ,תולו סוגיות,ם בדיון היו ארגוני משתמשים (ללא ספקים) אשר דנו במשתתפיהאו בחינת כלים שונים לארגונםהתלבטויות ושיתפו טיפים ולקחים מניסיונם בעקבות הכנסת

. משתמשי ארגונים אלו נמצאים כל אחד ברמות שונות של בחינה ויישום המוצרים כלים אלודרך הארגונים חיפושבארגוהחל ,ן מהארגונים הנמצאים בתחילת דרכם של הכנסת כלי

אשר כבר החלו בשלב בחינת הכלים ועד לארגונים הנמצאים בשלבים מתקדמים של הטמעת הכלים.

חשוב לציין שאין בסיכום זה המלצה גורפת ללקוחות אלא מתן פרספקטיבה והצגת התמונה .אשר עלתה במפגש

SIGTRS - Vol. 19 Num 2 - 12/2012 33

Page 35: sigtrs vol 19 num 2

תוכן עניינים

4 ............................................................................................... :בשוק כיום הקיימים הכלים

4 ...................................................................................................... :כיום בארגונים המצב

6 .................................................................... .ארגוניים חיפוש מנועי ליישום הרצויות תהשיטו

8 ............................................................. ?לטפל צריך החיפוש מנוע בהם התכנים סוגי הם מה

desktop search( ..................................................................... 9( שולחני חיפוש גביל מדיניות

01 ........................................................................................................ המורפולוגיה נושא

00 .................................................................................... השונים בארגונים העבודה שיטת

01 ........................................................................ הכלים בחינת נעשתה פיהם על קריטריונים

01 ....................................................................................... :הארגונים נחשפו אליהן תקלות

01 ............................................................................................................ :שהועלו קשיים

04 ............................................................................................................ :ותובנות טיפים

01 ..................................................................................................... .לפרויקטים דוגמאות

06 .................................................................. :המפגש לסיכום ויועצים ספקים תגובות – נספח

SIGTRS - Vol. 19 Num 2 - 12/2012 34

Page 36: sigtrs vol 19 num 2

הכלים הקיימים כיום בשוק:

(אין זו רשימה ממצה של כלל הפתרונות בשוק אשר הוזכרו במפגש הארגוני חיפושהכלי

:אלא רק אלה שעלו תוך כדי הדיון)

Attivio אטיביו •

Google גוגל •

FAST -מיקרוסופט •

• HP - אוטונומי

Difdoof -ף דפדו •

• Lucene (קוד פתוח)

• SES - אורקל

• Open Text

המצב בארגונים כיום:

בארץ Enterprise -חברות ה ון וכןימשתתפי הד הגדול של םשרובכיום בשוק הוא המצב

, מחצית מהם עושים שימוש (לאו דווקא כלל ארגוניים) חיפוששימוש כלשהוא במנועי עושים

(חיפוש מובנה בפורטל/מערכת ניהול במספר מנועים אשר מובנים במערכות השונות

ארגוני המחפש במספר מקורות -כללעושה שימוש במנוע חיפוש מסמכים וכד'), וחלקם

כלל אינן משתמשות בכלי חיפוש ארגוני.פחות משליש החברות .השונים

SIGTRS - Vol. 19 Num 2 - 12/2012 35

Page 37: sigtrs vol 19 num 2

מאוד השתנה החיפושמשתתפים רבים הסכימו כי :ה במהלך הדיוןתשהועל נקודה נוספת

ממוקד (אם היינו מחפשים מידע החיפוש היה בגדר של חיפוש . אם בעברבשנים האחרונות

אנחנו –שמו במפורש), כיום החיפוש קצת יותר אינטואיטיבי כותבים את יינואדם ספציפי ה

מצפים להיות מסוגלים לכתוב את השאלה עצמה ושמנוע החיפוש יפרש מה אנחנו רוצים

?)שעה נסגר.... ? באיזואיך אני מגיע ל...ויחזיר תשובה יותר ממוקדת (לדוגמה:

ממה משתכללים הרבה יותר מהר ורם לחברות להרגיש כי הצרכים של עובדיהםדבר זה ג

החברות הטכנולוגיות מאפשרות מקדים בהרבה את מה שקצב השוק שהן מסוגלות לספק,

לספק.

נשאלה שאלה נוספת לארגונים אשר אינם עושים שימוש כיום ,בהמשך לגרף הקודם בסקר

אין בסקר זה ניתן לראות כי מתי מתוכנן שימוש בכלי חיפוש בתוך הארגון? ל :בחיפוש ארגוני

מכלל יחד עם זאת באחוז מאוד גבוהו אך ארגון שאינו מתכוון ליישם כלי חיפוש בארגונ

הנשאלים סעיף זה אינו מתוקצב עדיין בארגונם.

30%

35%

35%

מבחינת שימוש בכלי חיפוש ארגוניים יםבארגונ הקייםהמצב .כיום

אנו לא עושים שימוש בכלי חיפוש ארגוני

אנו עושים שימוש במספר מנועים אשר מובנים

במערכות שונות

אנו עושים שימוש במנוע ארגוני המחפש -חיפוש כלל

במספר מקורות שונים

SIGTRS - Vol. 19 Num 2 - 12/2012 36

Page 38: sigtrs vol 19 num 2

השיטות הרצויות ליישום מנועי חיפוש ארגוניים.

ישנן שתי שיטות בולטות ליישום מנוע חיפוש ארגוני:

לתוכו הוא ,מערכהק תויימות ויוצר בסיס נתונים משלובר לעל אשר מתח-מנוע •

.ומספק ממשק לחיפוש בכלל המקורות מאנדקס את המידע מתוך המערכות בארגון

עושה שימוש בחיפוש המובנה של כל אשר ) federated search( על פדרטיבי-מנוע •

מסתמך על תוצאות הוא ).ללא אינדוקס מחודש של התכניםבפני עצמה ( מערכת

החיפוש של מנועי חיפוש אחרים ומספק ממשק אחד לאחזור כלל התוצאות.

מנוע החיפוש אשר מאנדקס בעצמו את כל המקורות לניתן לראות במקרה זה העדפה ברורה

יש לציין כי יש כאן שינוי מכלל העונים הגדישו כי זו השיטה הרצויה בארגונם. 69%המידע,

ממפגש מקביל אשר ערכנו לפני כמה שנים בו ארגונים ציינו כי הם מעדיפים מנועי חיפוש

פדרטיבייה .םשינוי (מעבר להעדפת מנועים שאינם פדרטיביםי) אכן משקף מה שאנו

שומעים מלקוחות בשוק.

2012/13מתוכנן ומתוקצב כבר ב

ללא סעיף תקציבי עדיין 2012/13 -מתוכנן ל

עתיד הרחוק יותר

36%

64%

0%

מתי מתוכנן שימוש , במידה וארגונך אינו עושה שימוש כזה כיום ? בכלי חיפוש בתוך הארגון

SIGTRS - Vol. 19 Num 2 - 12/2012 37

Page 39: sigtrs vol 19 num 2

ענו כי השיטה 6%ורק המאנדקס את המידע בעצמו, רבע מכלל הנשאלים מעדיפים מנוע

י הצורך.פ-וש במספר מנועי חיפוש שונים עלהרצויה מבחינתם היא שימ

ם מאחר יישנם מספר מנועי חיפוש ארגוניהתחושה שעלתה מן הדיון היא שהמצב כיום הוא ש

מנוע חיפוש ארגוני אשר מאפשר לאחד ארגוניות, והמטרה היא לספק מספר סביבותן וישנ

העובדים מאוד "מצפים" לקבל סביבת חיפוש מאוחדת מסוג זה אחת.את כל המידע לסביבה

שכן כך הם רגילים לעבוד באתרי האינטרנט.

עם עאת המערכת לניהול הידהם מאנדקסים אחד מתוך הארגונים הנוכחים במפגש ציין כי

אבל מה שמחפשים כיום זה כלי שיאפשר להם לאחזר מידע לא רק מילות המפתח.

ני תיקיות.יידע אלא גם מכל מיני מסמכימ ,םשרפויינט ועוד כל מ מהמערכת ניהול

בקרב ארגונים אשר עושים שימוש במנוע על פדרטיבי הם ציינו בעתיות בכך שישנו קושי

לבצע מר) גרדנקיב (גנתוצאות אשר מגיעות מכלל מקורות החיפוש דבר זה מקשה על

עבודתם.

0%10%20%30%40%50%60%70%

.על שיאנדקס את מקורות המידע בעצמו-מנוע

שאינו מאנדקס בעצמו אלא מפעיל את " (פדרטיבי"על -מנועשל , מנוע החיפוש של הפורטל –מנועי החיפוש השונים

).'מערכת ניהול המסמכים וכד

.על פי הצורך, שימוש במספר מנועי חיפוש שונים

69%

25%

6%

.תאר את השיטה הרצויה בארגונך ליישום מנוע חיפוש ארגוני

SIGTRS - Vol. 19 Num 2 - 12/2012 38

Page 40: sigtrs vol 19 num 2

לטפל? מנוע החיפוש צריךמה הם סוגי התכנים בהם

Single point of -הבא ממחיש עד כמה ארגונים מסתכלים על חיפוש ארגוני כהתרשים

search לחיפוש לא רק במסמכים, מיילים ומידע בלתי מובנה אלא מעוניינים שיהיה מקום

אחד מרכזי בו מחפשים נתוניב ,םין אם מובנים ובין אם לא מובנים, כאשר מיקום הנתונים

, פורטל, מערכת ניהול תוכן) לא צריך לשנות.BI(במערכות התפעוליות,

17%

83%

? באילו סוגי תכנים מנוע החיפוש צריך לטפל

).'אימיילים וכד, מסמכים(רק בתכנים בלתי מובנים

.וגם בתכנים בלתי מובנים DWב/במערכות התפעוליות-גם בתכנים מובנים

SIGTRS - Vol. 19 Num 2 - 12/2012 39

Page 41: sigtrs vol 19 num 2

) desktop search( מדיניות לגבי חיפוש שולחני

מכריע של הארגונים הברוב בדומה לתוצאה אשר קיבלנו בסקר מקביל לפני כמה שנים, עדיין

desktop search – כיום מדיניות בדבר השימוש בכלי חיפוש שולחניים אישייםקיימת לא

(הכוונה למנועי חיפוש המותקנים לוקאלית על התחנה ומאנדקסים את המסמכים המקומיים/

.ולא מנוע חיפוש ארגוני) –מיילים של המשתמש

עובדים שומרים את שקיים קיבוע של המצב שבו כל ההבעתיות אשר קיימת בחיפוש זה היא

ם צורך ה ,ךכבם (אין לההמסמכים שלהם לעצמם על המחשב ואינם מעלים אותם לרשת

דבר זה פוגע בשיתופיות של של המסמכים מוצאים כל מה שהם צריכים ומסתדרים טוב).

בארגון כולו.

הוא כזו. תיות הקיימת בארגונו בעקבות כך שלא קיימת מדיניותייבעהאחד הארגונים ציין את

מו ל אחד שומר את המסמכים לעצכשאו file serverהמסמכים נשמרים או בהסביר כי

צורך לתת יותר דגש ה העצמה של השני ,היא הרבה יותר גלובלית עכשיו כאשר החברהו

.החברה בעולם מסמכים עם סניפיהשיתוף בגלל ומחשבה לנושא

94%

6%

האם קיימת כיום מדיניות בארגונך לגבי השימוש של העובדים בכלי ?)( desktop search חיפוש אישיים

.לא קיימת מדיניות בנושא זה

. קיימת מדיניות

SIGTRS - Vol. 19 Num 2 - 12/2012 40

Page 42: sigtrs vol 19 num 2

נושא המורפולוגיה

הטיות של מילים (משמ ,המישימתמ ,ישימתנו), חקר המבנה הפנימי של מילים, -מורפולוגיה

הנטייה וחקר צירופים קצרים של מילים, שאינם משפטים התכונות המסומנות באמצעות

שלמםי (ויקיפדיה).

נושא המורפולוגיה עלה הרבה במפגנ ,שוכחים רבים ציינו כי תכונותיו נדרשות מאוד בהקשר

אנו גם רואים שבבואם של ארגונים לבחור כלים זוהי אחת מהדרישות של חיפוש ארגוני.

ורפולוגיה.תמיכה במ – Checklistהמצוינות ב

מכלל העונים אינם משתמשים 14%לפי הסקר שערכנו ניתן לראות כי רק ,לראיה

כוונים לעשות זאת.תבמורפולוגיה ואינם מ

היכולות המורפולוגיות נרכשות כתוסף לכלי חיפוש בו הארגון משתמש, בארץ ישנו היצע קטן

מורפולוגיה.י לבנוגע לכ /מילוניםמאוד מצד מפתחי הטכנולוגיה

כלי בולט במיוחד אשר הוזכר כי נבדק על ידי כל הארגונים שנכחו במפגש הנו מלינגה .ווזכר

כי ישנם גם כלים נוספים.

לא ולא מתכננים .כן .להשתמש

לא ומתכוננים .להשתמש

14% 14%

71%

? ישנו שימוש ביכולות מורפולוגיות בארגונך האם

SIGTRS - Vol. 19 Num 2 - 12/2012 41

Page 43: sigtrs vol 19 num 2

אחד היתרונות שחשובים בעיניו לכלי מורפולוגי הוא הסאונכמ .סקדו אחד הארגונים ציין כי

ל אייפון שתוצאות ם גחיפוש יעלו הפון בעברית אז בתוצאות כן, אם מישהו רשם איי

באנגלית.

וכי ,רכיב של אישים מקומות וזמניםקיים בארגונו לכלי מורפולוגי שיש ארגון נוסף ציין כי

פיהם. גם מסמן אותם ויודע לחתוך על מתוך המלל, יודע להוציא שמותהכלי

ישים כי הם זקוקים בארגונם ליכולות גדיחד עם זלמר ,תאות שארגונים רבים מ

.במקרים רבים נופל בשל הנושא הכספיהם מסכימים כי נושא זה ,המורפולוגיות

ן צורך אחד הארגונים ציין כי הוא רכש כלי חיפוש וכלי זה מגיע יחד עם מורפולוגיה וכך אי

.לרכוש את שני הכלים בנפרד

עם כלי פיילוט אותו הם מעוניינים לבצע הדבר נוסף שציינו ארגונים כנושא בעייתי זה עניין

וכך הארגון ,מקורות של הארגון עצמוהמורפולוגבמקר .יים רבים פיילוט זה אינו אפשרי על

". פיילוט אמיתי"ארגון ראה לפי הגדרתו האו מבלי ש נאלץ לקנות כלי כאשר זה לא נבדק כלל

כלים אלו תופשים כלים קודם, ארגונים רביםי מבחינת הארגונים כי כפי שצוין דבר זה בעיית

קרים.יכ

ארגונים אשר אינם מתעניינים כלל בנושא מורפולוגיה הדבר נובע אצלם מכך שהם עובדים

עם ערכים מובנימ ,םונחים מקצועיים, פריטימ ,םוצרילד ,םוגל :אמשם איתור תקלות

ים.בשרת

השונים שיטת העבודה בארגונים

לא מתחילים להקים .מכים בארגונו נוצרים עם מאפייניםאחד הארגונים סיפר כי כל המס

בדרך כלל אחריות זו חלה .זוהי דרישת סף בארגון -מסמך אם לא הוקמו קודם כל מאפייניו

יש ,נושא המסמכים הוא מאוד קריטי המדובר בפרויקטועל היוצר של המסמך אך במקרה

אחראי לעקוב אחריו עם document management - שלוהמוגדר אדם שזה התפקיד

ליך מסודר מסוג זה (שבהחלט לא רואים בכל ארגון ובטח לא לכל בצמ) תה. WF תהליך

בגלל המאפיינים הקיימים על כל מסמך ומסמך. ויעיל, להיות מאוד נוחהופך את החיפוש

SIGTRS - Vol. 19 Num 2 - 12/2012 42

Page 44: sigtrs vol 19 num 2

ארגון אחר ציין כי הם אינם מנהלים מאפיינים כי המסמכים נמצאים במקומות ,לעומת זאת

קרה זה ידע לאתר עבורם את המסמך.רבים ולכן סומכים על כלי החיפוש אשר במ

ובהרבה מתעסקים בהמון מסמכים וביקורות ארגון נוסף שיתף אותנו כי אצלו בארגון

בעבר . OCRאפילו לא ניתן לבצע עליהם מהמקרים המסמכים הם במצב ממש רע כל כך ש

אך הארגון ציין כי ,של המסמכים פתוחחייבה לבצע מ מערכת אשר הייתהבארגון זה

ניתן מצד שני מסמכים שלא באופן טבעי מתלוננים על קושי בביצוע המפתוח. העובדים

רוצה שהעובדים יעשו את לא עייתי עבור הארגון. ארגון זה כמובן ב –להוציא מהם מידע

רואים את נושא המסמך באופן אנשים שוניםש ווןכימכי יהיו לכך תוצאות שונות נושא התגיות

שונה ורושם תגיות שונות לכל מסמך.

דטה.מטהדואגים שלמסמכים יהיה ארגון נוסף ציין כי בארגונו קיים ניהול איכות ובעזרת כך

קריטריונים על פיהם נעשתה בחינת הכלים

הוא אחד הכלים אשר איתו הם מכיוון ש FASTאחד הארגונים סיפר כי הם בחרו ב • יכלו להתחיל לעבוד ישירות.

ציין שלמרות שהוא FASTארגון שבדק את הפונציונאליות של גוגל אל מול זאת של • ."סגורים"וגוגל הרבה יותר יותר גמישים FASTבכל זאת מצא אותם די דומים,

נקנה על ידי מיקרוסופט FASTשזה מספר ארגונים ציינו כי הם מרגישים שעצם • .FASTרעת ל פועל

לזה של דומה של מוצר זה ובאטיביו ציין כי בסיסאחד הארגונים אשר משתמש •FAST אחד יתרונות הבולטים כי כי שניהם למעשה נבנו על ידי אותה חברה. הוא ציין

שונים ולהביא מקורותת והיכולת לפתח קונקטורים ליכולת הפתיחו היאשל אטיביו הפתרון של , אותו ארגון ציין כיכמו כן .אותם מקורות חיצונייםתוצאות מידע גם מ

אטיביו מגיע עם מנוע מורפולוגי של מורפיקס מובנה בתוכו. מאוד מוכוון שרפויינט. FASTצויין כי •

ונים שיתף את המשתתפים בסיבות אשר בגללן לא בחר את מוצר גאחד האר • ,לא התחברו לארכיטקטורה של גוגלהם אחת הסיבות הייתה כי החיפוש של גוגל:

,בנוסף .לחיפוש הפנים ארגוני יש הרבה יכולות אך לא מרגישים כי לגוגל שניתשמקבלים ולא מתעסקים איתה. כמו כן רואים את גוגל היא קופסא שחורה רואים כי

לקנות מחדש. /שנים צריך לחדש רשיונות 3כל ש זה כבעייתי

החליט ללכת על FASTלבין גוגל אנטרפרייס ארגון נוסף אשר ביצע בחינה בין •FAST ל מקורות התוכן כולל אתרים הוא מאנדקס להם את כש מכיוון של שרפויינט

, מה קונקטורים כוללכי הוא ו ,הגבלה ללא וחיצוניים וכולל מערכות תפעוליותפנימיים שהופך אותו ליותר נוח לעבודה מבחינתם.

SIGTRS - Vol. 19 Num 2 - 12/2012 43

Page 45: sigtrs vol 19 num 2

פתוחות נותן פתרון טוב אך ישנם הרבה תקלות FASTציין כי לדעתו אחד הארגונים • אינו מהיר.מניסיונו הוא והטיפול בהן ל מיקרוסופטמו

הוא עובד לא ציין כי SESמנוע החיפוש של אורקל אחד ממשתתפי הדיון שעובד עם •נושא מורפולוגיה לא מעניין אותם מהסיבה שהמונחים שלהם . בארגון זה רע היום

באנגלית.הם מקצועיים, פריטימ ,םוצרים ופחות מונחים אחרים וכמובן הרבה

:הארגונים נחשפו ןתקלות אליהבסופו של דבר נאלץ לתת מענה ו FASTפתוחות מול אחד הארגונים נתקל בתקלות רבות

בעצמו באופן עצמאי כי לא קיבל פתרון בזמן מהחברה.

יכולת בסיסית של המערכת אמורה להיות . auto complete -בעיית העוד בעיה שצוינה:

. יש מילונים auto complete -ב out of the box . המערכת תומכת תלא עובד היאו

צריך להיכנס למילון ובפעם היה לשאילבמקרה ,הת בו כתבת שאילתה וחזרו תוצאות זה

.(כאמור, לא ממש עובד) הערך יופיע ,הבא שמישהו יתחיל להקליד את המונח

:שהועלו קשיים

עושים הרבה מאוד וכי הם -רשאות מאוד קריטיתסוגיית ההאחד הארגונים ציין כי בארגונו

הרשאות ולמנוע זליגת מידע או טעויות אנוש של המאמצים על מנת לעקוף את הנושא של

. זה קשה ודרושה התערבות בשלב מסוימיםהעלאת מסמכים שאסור להעלות למקומות

האינדקס.

בכלי out of the box זה לדעת מה הם מקבלים ארגון נוסף ציין כי הקושי העיקרי עבורם

.חיפוש אותו הם רוכשים

אחת מהבעיות ביישום כלי חיפוש פנים ארגוני הוא הציפיה לקבל אותה חוויית חיפוש בארגון

כפי שאנו מקבלים מחיפוש אינטרנטי / גוגלי או אחר, מה שלא קורה בפועל כי המסות הרבה

המערכת כן לומדת תוצאות אך לא י אחד מהארגונים כיין על ידצויותר קטנל .תודוגמה,

צריכים את זה בארגון.היו מספיק מהר כפי שהם

"עסקית": לוגיקה הלבנות את כל ה זה בנושא זהעבורו הכי קשה החלק ציין כי ארגון נוסף

? לפי אילו נושאים הם יקוטלגו?יראוהן איך ?איך יגיעו התוצאות

יש להם מערכת לפי דבריהם כרגע בבעיהמרגישים שנמצאים הם אחד הארגונים ציין כי

היא האם דילמהאותה ואולי כדאי להחליף אף שאולי קצת מיושנת ו בארגון לניהול ידע

SIGTRS - Vol. 19 Num 2 - 12/2012 44

Page 46: sigtrs vol 19 num 2

מספיק להחליף אותה ולשדרג למערכת אשר בה המנוע החיפוש יהיה יותר מתוחכם או

רכת ויהיה מענה לזה גם שצריכים את הרובד העליון הזה ואז לא יהיו זקוקים להחלפת המע

מערכת היא בה הם משתמשים לפי הגדרתם המערכת לניהול הידע .ממקורות מידע אחרים

נגנון חיפוש לומד והוא מציג ל מערכת טובה, היא מחזירה תוצאות וגם יש לה מובסך הכש

מילות -ייב אינדקסיםל מחוהכעיה היא שאין את החיפוש החופשי והב .Top 10 -את ה

את האופציה של , והן ידעמערכת לניהול יישום את האופציה של הן ןבוחרגון זה אמפתח.

יה (לתחושתם כנראה יצטרכו את שניהם).מנוע חיפוש שישב מעל

:ותובנות טיפיםתוצאות החיפוש . כאשר מתקבלת של דירוג י תוכן שיוכלו לבצעלמנהחשוב שיהיו •

לפי ר את התוצאותלמערכת ויודעים לסדמנהלי התוכן נכנסים ,לא תוצאה לא רצויה

.סדר שהגיוני לאותו ארגון

, אינו אומר שהעבודה שלנו הסתיימה מנוע חיפושבנו עזה שהשקשצריך להבין •

!להחההעבודה רק

כאשר חיפשו משהו ,בודקיםר בעזרתו הם שאיש להם דוח ארגון אחר ציין כי •

יש ?מה עושים בהתאם לכך ?מה זה קרהל- המערכת לא הניבה תוצאותובמערכת

אם ישנם צורך להבין האם זה חשוב שמאחורי חיפוש זה אכן תופיע תוצאת חיפוש.

מסמכים שניגשים אליהם לחילופין, או ?מדוע זה קורה ,אליהםמסמכים שלא ניגשים

וכך הלאה. ,יותר מדי

הטוב רון הפתשלארגונים אשר אינם יודעים מה יש להם בכל מאגר תוכן יכול להיות •

מקורות התוכן האלו ורות התוכן הקיימים בארגון ועלמקביותר זה לאנדקס את כל

.של המידע) PROFILING(מעין להפעיל את המנוע החיפוש

. לא בטוח שמנוע מביא אתן למנוע החיפוש ללמוד את התוצאותבהתחלה לוקח זמ •

ות המתאימות ביותר לאותו חיפוש.התוצא

.פיתוח חיצוני מאוד מקשה על התהליך הזהעדיף לעשות את הפיתוח בתוך הבית כי •

יש צורך להבין את כל הצרכים מכלל הארגון ומשם לפני שמתחילים פרויקט •

להתקדם.

SIGTRS - Vol. 19 Num 2 - 12/2012 45

Page 47: sigtrs vol 19 num 2

.דוגמאות לפרויקטים

במנוע החיפוש יםמאנדקס :ניהול הידעמשתמשים במידע של מערכת אחד ארגונים ב •

מערכת הנהניהול הידע . מערכת הידע משתמש במנוע החיפוש ל ניהולוהממשק ש

אך היא לא חזקה מספיק בחיפוש ובשאילתות, ,שטובה לנציגים ולפעילות הפנימית

עונה לגמרי על לא ארכיטקטורה פשוטה אך ו אמנם. זמענהנותן מנוע החיפוש לזה

ת לאחר שמממשים א , אבלשום דבר לא פשוט בהתחלההצרכים של הארגון.

מעכשיו והלאה.את הארגון שמש ת הראשונה, היאפעם התשתית ב

כאשר הם עושים חיפוש הם לא מקבלים רשימה אחת םהיוארגון נוסף שיתף כי •

לדף שנקרא יוביל "חשבון"פתיחת (חיפוש שלארוכה של פרטי תוכן אלא לינק לדף,

ת, התהליך הדוחו - המידע מהמקורות השוניםנראה את ובדף הזה "פתיחת חשבון"

שיכול פשים ולא את המידע הספציפיכדי שיהיה מבט כללי על מה שמח ,וכו'

לכן הלוגיקה העסקית היא ל.והמשתמש לקבל כי אין מערכת אחת שמכילה את הכ

?עכשיוחשובים מסרים לואי - השיווקי היבטם מה, גמה להביא, מאיפה - הבעייתית

?איך מבצעים את כל התהליך

משלהם שיעזור למצוא את כל הנתונים "גוגל"ניסו ליצור חד הארגונים שיתף כי הם א •

-מדברים על טיפול בתקלות, דטה בייס מסויימיםהם. חלק מהנתונים אלו החשובים ל

הם עשו לכל זה את האינדוקס, החליטו להשקיע באינדוקס כך שבלחיצת כפתור

עושים את ,בטיפול בתקלותחוסך את כל הנתונים מכל מני מקומות. מקבלים

רגון גדול, בארגונים קטנים זה בטוח יהיה יקר יותר תוח אצלם וזה קל כי הם אהפי

עצם זה שהם מאנדקסים ויותר קשה להם יש אנשי מקצוע שיכולים לעשות את זה..

את המידע זה יוצר להם לינקים וכאשר מקישים עליהם אז מגיעים למערכת עצמה

גיעים למידע עצמו.מתוך המנוע החיפוש מ

ההרגשה שעלתה מן הדיון היא שקיים צורך בכלי חיפוש ארגוניים אשר כל הזמן לסיכום,

מקבל דחיפה מכיוון האינטרנט החיצוני. יש הרגשה ש"לא יכול להיות שאין בארגון מקום אחד

בו ניתן לחפש את כל המידע". יחד עם זאת, קיימות סוגיות בעייתיות באשר להכנסת כלים

מה כדאי –מפתוח והאינדוקס, דרך הלוגיקה העסקית של החל משיטות ה –כאלה לארגון

להציג כתוצאת חיפוש לאיזו שאלה, אבטחת מידע וחשש מזליגת מידמ ,עורפולוגיה, וכן

הלאה.

SIGTRS - Vol. 19 Num 2 - 12/2012 46

Page 48: sigtrs vol 19 num 2

:ספקים ויועצים לסיכום המפגשתגובות –נספח

תגובת חברת נס

הלומד –סוגיית הכלי הטכנולוגי שיתמוך בחיפוש הארגונמ ,ישקפת את דמות המשתמש

מרבית האפליקציות השכיחות מסביבנו מאפשרות חיפוש אינטואטיבמ ,יורפולוגי החדש.

וממקורות מידע מגוונים.

סביבת עבודה דומה בארגון שלו. כאן קיים פער, שבא הציפיה של המשתמש היא "לפגוש"

לידי ביטוי גם בממצאי המסמך. בבסיס הדיון שנעשנ ,הוגעים למעשה בנושא מרכזי וכואב

ניהול הידע. המגמה בתחום ניהול הידע התחילה בפורטל משותף שבו מרכזים –בארגונים

דחיפה/משיכה של מידע חומרים משותפים, כדי לצמצם את השמירה במחשבים האישיים, ו

למשתמשים. עם הצפת המידע, ומגבלת יישור קו באופן ניהול תצורת ואינדוקס מסמכים,

עולה הצורך בנגישות מקסימלית למידע, ובמהירות.

הלומד החדש, מחייבת דינמיות בארגון, –שילוב הצורך הארגוני יחד עם ציפיית המשתמש

והקצאה של משאבים נדרשים לצורך זה.

ומנהלת חטיבת ההדרכות בנס ישראל VPעדי זמיר, -יצירת קשרל

[email protected]

SIGTRS - Vol. 19 Num 2 - 12/2012 47

Page 49: sigtrs vol 19 num 2

תגובת חברת מטריקס

ואחזור מידע ארגוני מטריקס מייצגת כיום שני פתרונות מובילים בשוק המספקים מענה לחיפוש

ומאפשרים מציאת המידע בהקשר המתאים וראיית תמונה שלמה של כל המידע המנוהל בארגון:ממגוון –מובנה ולא מובנה –ר מידע באשר הוא ופלטפורמה לאיסוף, ניתוח, איחוד ואחז -�אטיביו

ל הידע, המלצות מקורות, פורמטים ושפות המאפשרת קטלוג, סיווג, וחיפוש של מסמכים, ריכוז ניהו

תוכן, התראות והפצה של תוכן חדש, ניתוח טקסטים ואיחוד של תוכן מורכב ומגוון על מנת לתת

מובילה בתחום חיפוש וניתוח טקסט בעברית, ערבית - מלינגו תמונה מקיפה של המידע למשתמש.

ערבית מנועים מרכזיים: אדפטור מורפולוגי לשפה העברית, ה 1פרסית ושפות נוספות ומספקת

ומנוע לניתוח, הבנה וחילוץ ישויות מתוך טקסטים Search Concept - CSוהפרסית המוצר נקרא

המתמחה בשפה העברית ובשפות שמיות, המטפלים בנושאי תיוג אוטומטי וניתוח תוכן. המוצר נקרא

ICA – Intelligent Content Analysis . אתה שילוב הפתרונות מאפשר להבין את השפה, ולהתמודד

ברבדים של מושגים ומשמעויות, לפענח את שאילתות החיפוש בהקשר הנכון, לנהל מילוני מושגים

ארגונים וכן להפעיל מנגנוני ניתוח וחילוץ ישויות מתקדמים על התכנים המאונדקסים לצורכי, תיוג,

סיווג, קטלוג וניתוח הטקסטים ומספק מענה בתחומים הבאים:

מערכות קבצים, אימיימ ,לערכות ניהול ושיתוף מסמכים (לדוגמה –ת תוכן גישה למגוון רחב של מקורו .0

Documentum, SharePoint.בסיסי נתונים, אתרי אינטרנט, רשתות חברתיות, ועוד ,(

שפות כולל עברית, אנגלית, ערבית, רוסית וכדומה. כולל ניתוח 41-תמיכה ב –יכולות מורפולוגיות מקיפות .1

מורפולוגי מעמיק ויכולות כריית מידע

ייחודית בעולם התוכן הלא JOINיכולת חיבור בין מידע ממקורות שונים ומגוונםי, כולל יכולת –איחוד מידע .1

מובנה

יכולות עיבוד ושליפה מהירות על שרת יחיד (מאות בשנייה) ויכולת גדילה –ביצועים ויכולת גדילה לינארית .4

הבודד או תהליכים שלמים. לינארית ברמת הרכיב

יכולות מתקדמות של כריית מידע גם בעברית (הודות לשילוב מנועי מלינגו בפתרון) הכוללות –כריית מידע .1

.ניתוח נימה ורגשמטי , , קטלוג אוטו Keyword Extractionחילוץ ישויות,

בלי לפגוע בביצועים או ברמת אבטחת מידע מקסימלית למניעת כל זליגה של תוכן מ –אבטחת מידע .6

הניתוח / חווית המשתמש.

התאמת חווית המשתמש לצרכים האישיים דרך בניית פרופיל משתמש ולמידת –המלצות ופרסונליזציה .7

השימוש במערכת להמלצות תוכן ודירוג תוצאות.

ורות תוכן פשטות המודל והקונפיגורציה מאפשרת חיבור מהיר של מספר מק –גמישות בהטמעה והפעלה .8

לצרכים הייחודיים של הארגון. בלחיצת כפתור תוך יכולת התאמת תהליכי העבודה

9. TCO ו- ROI - עלות אחזקה נמוכה תוך חיסכון ניכר בחומרה ומשאבי זמן יקרים ובנוסף הגברת התועלת

.לארגון תוך ניצול מקסימלי של הידע הארגוני הקיים ו/או נלמד לאורך זמן

054-7929620 ,מוצר, חטיבת מוצרי תוכנה, מטריקסשרון שוורצמן, מנהלת לפרטים נוספים: [email protected]

SIGTRS - Vol. 19 Num 2 - 12/2012 48

Page 50: sigtrs vol 19 num 2

HPתגובת חברת

ארגונים נדרשים ולהבין מהו המידע הרלוונטי מתוך מקורות תוכן רבים ומגוונים כגון מיילים,

מעבר לחיפוש של מילה או מונח מסוים, קיים צורך מסמכים, וידאו, רשתות חברתיות ועוד.

מתוך מאסה של נתונים ובכך לאפשר לארגון להיות תחרותי ולהגיב לשינויים לתובנותלהגיע

נת יחברת סלולר ולה שירות לקוחות היתה מעוני –ניתן להדגים זאת באופן הבא בזמן אמת.

ם המילה נאמרה במפורש או החברה" בין א קוח מדבר על "נטישתבזמן אמת מתי ל הותלז

יתה מעוניינת לדעת ידוגמא אחרת היא השקה של מוצר חדש, חברה ה ע"י זיהוי טון השיחה.

–לשם כך התגובה לגבי אותו מוצר ברשה ,תיתרבחה תאם היא חיובית/שלילית וכיו"ב. ימה

ים ) ממקורות שונBig dataנדרש מנוע שמסוגל להתמודד ולהבין כמויות גדולות של מידע (

Multichannel Analytics .בזמן אמת

IDOL –Information Data Operatingמאפשרת באמצעות מנוע ה HPחברת אוטונומי מבית

Layer .בחודשים האחרונים, אנחנו רואים שעולה הדרישה אצל להתמודד עם האתגרים הללו

לקוחות בארץ לפתרונות בנושאים הבאים:

• OSINT – Open Source Intelligent - ,מודיעין עסקי ו/או תחרותי מתוך מקורות גלויים

.אשר כולל מידע מתוך אתרי מתחרים, רשתות חברתיות, ערוצי תקשורת ועוד

צורך שקיים אצל ארגונים - eDiscoveryפתרונות בתחום הגנה וניהול המידע המידע כגון •

.שכפופים לרגולציות ותביעות משפטיות

• Multichannel Analytics – תמונת מבט אחודה על היישויות העסקיות יכולת לקבל

השונל ,תודגו' "לקוח" ממקורות תוכן שונים לדגו' אתר האינטרנט מ ,הרבחה לשוקד

.שירות הלקומ ,תוחיילים ועוד

בו בהחלט הארגונים Big Data -נושא החיפוש הינו נושא חם מאד בעידן ה מה אנחנו רואים?

די שנה ונדרשים פתרונות מתקדמים להתמודד איתו. במידע שמכפיל את עצמו מ"טובעים"

" = I, כאשר הדגש הוא על ה "Information Revolution in IT -אוטונומי מגדירים את זה כ

Information. ?שפות 071לאוטונומי תמיכה מלאה ב מה היכולות של המוצר בעברית

קונקטורים למערכות שונות ומעל 411רמטים שונים, פו 0111 –(לרבות עברית), תמיכה בכ

.פונקציות שונות לניתוח והבנה של מידע 111

ישראל ES ,HPמנהל פיתוח עסקי באגף האפליקציות של חטיבת –עמית מנור

SIGTRS - Vol. 19 Num 2 - 12/2012 49

Page 51: sigtrs vol 19 num 2

זכרון לטווח רחוק

____________________________________________________

שגיא כהן

SIGTRS - Vol. 19 Num 2 - 12/2012 50

Page 52: sigtrs vol 19 num 2

19.8.2012 | ידיעות אחרונות | ממון

Ben-Gurion Flight Schedule :לטסיםלידיעת הנוסעים לחו"ל: אפליקציה המספקת

תצוגה נוחה בזמן אמת של כל הטיסות היוצאות והנכנסות בשדה התעופה בן�גוריון

ב־2.5 מיליון מסמכים שעברו דיגיטציה, הרבה? נשמע מיליון. מ־3 יותר השנה הפריטים לכמות מתקרב לא אפילו זה

המאוחסנים שם, שרק הולכת וגדלה. כדי להמיר לפורמט דיגיטלי כמויות סורק מספיק לא חומרים, של כאלה פשוט מן הסוג שיש לכולנו בבית. מעבר לסורקים ולמצלמות המשוכללות, ביד שממיר מתקדם מכשור מחזיקים ושם נהגו באמצעותם — מיקרופילם סרטי ארכיוניים מסמכים בעבר "לצלם" הווידיאו סרטי דיגיטליים. לקבצים —יותר; גדולה בעיה כבר הם הישנים כדי להקרין את חלקם יש צורך במק־

רנים שפשוט כבר לא קיימים. לכן, חדר כמו קצת נראה ושם ביד הדיגיטציה עם האלקטרוניקה, לתולדות מוזיאון ומעלה. שנה 60 בנות הקרנה מכונות מוזיאון כמו פחות נראה אגב, השאר, סטארט־אפ חברת משרדי כמו ויותר מול רוכנים צעירים פיתוח: מהרצליה מותקנים הקירות על מחשב, מסכי מסכי פלזמה, וכל המכשור מבהיק ומ־תקדם. באולם סמוך שוכנת חוות השר־תים, המאחסנת למעשה את כל ארכיון הדיגיטלי יקר הערך של יד ושם — עם דיגיטליים אובייקטים מיליוני מאות

מכל סוג. וכן, לכל זה יש גיבוי.

עדויות ב־8 גיגהאת לבצע היתה יכולה לא ושם יד כל תהליך הדיגיטציה וההנגשה לבדה. לכן נרתמה למשימה בעלת ברית בעלת מבוטלות: בלתי טכנולוגיות יכולות

ענקית החיפוש גוגל. ארכיון הצילומים של יד ושם יושב

והפלטפו־ התשתית גבי על למעשה מאונדקסים הצילומים גוגל. של רמה הדיגיטלי (המידע מטה־דאטה עם ש"צרוב" בקובץ על התמונה אבל לא מופיע בה) כמו שמות, מקומות ושנים, מה שמאפשר לחפש תמונות וגם לקט־

לג אותן ביעילות. כל אחד יכול להגיע האינטרנט באתר הצילומים לארכיון של יד ושם, ישירות דרך גוגל, לצפות ולהשתמש אותן להוריד ואפילו בהן בעבודות למשל — האישיים לצרכיו

או מצגות.אך האתגר הגדול שהעמידו ביד ושם לגוגל היה הווידיאו, אותו ביקשו להע־לות ליוטיוב. ויש הרבה וידיאו — עש־

רות אלפי עדויות שאורך כל אחת מהן מגיע ל־3 שעות ואף יותר, קבצים שגו־

דלם מגיע עד 8 גיגה. "אנחנו מחזיקים על השרתים שלנו 200 אלף שעות של וידיאו דיגיטלי, אני מעריך שזו מערכת

ה־VOD הגדולה בארץ", מחייך ליבר. עסקו לא היום שעד דברים "אלה בהם", הוא מוסיף. "אלה לא אותם קלי־פים קלאסיים קצרים של חתולים שא־

נשים מעלים ליוטיוב". אמנם ביד ושם מפעילים ערוצי יוטיוב עם קטעי עדויות ערוכים וקצרים יחסית. אך המטרה היא להעלות לרשת גם את החומרים הגול־המקוריות. הבעיה: מיים: את העדויות קשה מאוד להתמודד עם העלאת מאות טרות של מידע ולהנגיש אותן ביוטיוב. מאוחסנים גוגל של הווידיאו בשירות וידיאו סרטי של שעות 3,000 כבר

כאלה, אך הם עדיין לא נגישים. ההעלאה של כמויות החומר הזו מו־מהתשתיות בישראל, מס־ גבלת מאוד

בתהליך יקר ואיטי. ביר ליבר, ומדובר

הוא מודה, כי היכולות להעלות ולעבד קבצי וידיאו ענקיים קיימת — אך ביד בקצב זאת לבצע עדיין מתקשים ושם החומרים כמויות עבור הנדרש גבוה עם גם מתמודדים "אנחנו שנאגרו: מחסור בתקציבים, משאבים וכוח־אדם.

אנחנו לא חברת טכנולוגיה".השלב לא היא הווידיאו העלאת שילוב על עובדים ושם ביד האחרון: של טכנולגיות שעוסקות בזיהוי דיבור, כאשר הרעיון הוא להעזר בהן לתמלל אוטומטית את העדויות — ואז להדביק עם שיסונכרנו אוטומטיות כתוביות הקול, או ליצור מסמכים שניתן לתרגם

ולחפש בהם. אנח־ גוגל של הצעצועים "בחנות ברי־שימוש. דברים הרבה מוצאים נו חשבו שהם השימושים תמיד לא אלה

עליהם", מעיד ליבר.

עידן הרשת החברתיתלדברי יו"ר יד ושם, אבנר שלו, "על

ורלבנטי משמעותי זיכרון לקיים מנת מא־ עושים אנחנו הבאים, בדורות גם מצים למצוא דרכים להפוך את אוספי והמגוונים העצומים והיידע המידע לנ־ השנים במהלך ושם ביד שנאספו

גישים עבור קהלים רחבים ככל שניתן, לשם כך אנו עושים שימוש בכלים הט־שיתופי ביותר. המתקדמים כנולוגיים פעולה כמו זה שאנו מקיימים עם גוגל, האוס־ את להנגיש ושם ליד מסייעים פים שלו לקהלים חדשים שטרם נחשפו

אליהם, ובמיוחד לקהל הצעיר".אחד ההיבטים המעניינים של הדי־

העצום הארכיון של וההנגשה גיטציה ביד ושם הוא השלב הבא: שיתוף אק־טיבי של קהילת הגולשים. מבחינת דו־

מדובר והיסטוריונים חוקרים של רות ומסמכים היסטוריות עדויות בטאבו: הם השנייה העולם מלחמת מתקופת הרחב. לציבור ולא למקצוענים עניין אך ביד ושם כבר אימצו תפישות שעו־

הרשתות עידן עם אחד בקנה מדות גולש לכל בהן וויקיפדיה, החברתיות

יש חשיבות.פתוחים מסוימים פריטים למשל, לת־ להוסיף, שיכול הציבור, לתגובות

בודקים ההערות כל את להעיר. רום, מתקנים. נכונות, הן ואם המומחים, הכיוון על שחשבו הראשונים "אנחנו הזה, ופתחו את הארכיון למיקור המו־

מאפשרים "אנחנו גרטנר. אומר נים", פריטים על תגובות להשאיר לקהל — ממש כמו בפייסבוק. 700 איש כבר נרשמו כתורמים למאגר המידע ושלחו יותר מעשרת אלפים תיקונים והערות. לא פחות מ־80% מהם התבררו כטובים

ובעלי ערך".

לה־ לקהל לתת שאין שטענו היו לא האנשים שיביאו שהמידע תערב, מהימן מספיק. "אבל בתנאים מסוימים זה יכול לעבוד", אומר גרטנר ומדגיש המגיבים על־ידי שניתן מידע שכל

נבדק היטב.

שיטת ויקיפדיהיש בחוץ שלציבור מבינים "אנחנו ידע שיכול להרחיב", מוסיף ליבר. "יש דברים שהמומחים ביד ושם לא יכולים לדעת אבל הציבור כן". למשל, תמונה של בניין בעיירה פולנית נסרקה ועלתה לארכיון ברשת. גולש אחד הגיב וטען כי נסרקה הפוך — כתמונת מראה. "איך אתה יודע?" שאלו אותו אנשי יד ושם. שהבניין ורואה מהחלון, מסתכל "אני שהוא התברר השיב. נכון", הלא בצד בת־ שצולם הבניין מול כיום מתגורר מונה. "אין לי שום מומחה שיכול לדעת

את זה", מחייך ליבר.ערך הקהל לתרומת כי מתברר, שהפרטים מבינים ושם ביד עצום: המש־ לבני מאוד חשובים הקטנים

לערוך אנשים שמעודד מה — פחות שורשים, עבודות פרטיים, מחקרים של ההיסטוריה את לעומק שבודקות המשפחות ושל המקומות מהם הגיעו. ליד ושם אין כוח־אדם לעשת מחקרים כאלה. "ההיגיון אומר: בוא נקלוט את בשיטת מהציבור הזו האינפורמציה את "נמצא ליבר. מוסיף ויקיפדיה", הצנזור. יהיה לא ושם יד שבה הדרך, מושל־ לא התוצאה בוויקיפדיה, כמו

מת, אבל לא רעה"[email protected]

Paris metro subway guide :על המטרוטסים לעיר האורות? בעזרת האפליקציה הזו תוכלו

להתמצא במטרו כמו פריזאים אמיתיים, גם ללא חיבור לרשת (למשל, בתחנות התת�קרקעיות)

Zappix :ישר למטרהכך תוכלו לעקוף את התפריטים הקוליים במוקדי

שירות: האפליקציה הופכת אותם לתפריטים ויזואליים, וחוסכת זמן יקר ותסכול

9

בחדר הדיגיטציה נמצאות מכונות הקרנה בנות

60 ומעלה לצד מה שנראה כמו סטארט�אפ מהרצליה פיתוח: צעירים רוכנים מול מסכי מחשב, מסכי פלזמה ומכשור מבהיק ומתקדם.

באולם סמוך שוכנת חוות השרתים

סריקת אלבומים. מיליוני מסמכים עברו דיגיטציה

ממון | ידיעות אחרונות | 19.8.2012

שגיא כהןבחדר קטן, בקומה הראשו־נה בבניין ההנהלה ביד ושם בירושלים, יושב צעיר מול ומ־ קרועה קטנה, פתקית צהיבה, שעליה משורבטים כמה משפטים בפולנית. הוא מצלם אותה בעזרת מצל־בשווי ענקית, עדשה בעלת יחודית מה עשרות אלפי דולרים, שמסוגלת לייצר ביותר. הגבוהות ברזולוציות תמונות בחדר הסמוך שוקד צוות צעיר על המרת המתעדים מיקרופילם, סרטי אינספור מסמכים מתקופת השואה, לקבצי מחשב

בגודל של עשרות גיגה־בייט.סטודנטים עומלים משם רחוק לא של ידנית סריקה על חלקית במשרה תצ־ תעודה, אחר תעודה דף, אחד דף

לום אחר תצלום; כולם שרידים דוממים, מקומטים, דהויים, בלויים, קרועי קצוות — שהופכים בן רגע לביטים דיגיטליים, המאוחסנים על שרת. את השילוב ההזוי היסטוריים ארכיוניים פריטים בין הזה, המ־ הטכנולוגיה לבין השואה מתקופת

תקדמת בעולם, אפשר למצוא כנראה רק ביד ושם.

הש־ עם נאגרו מסמכים מיליון 142נים על מדפי הארכיון שם, לצד 410 אלף תצלומים ו־110 אלף עדויות, שנפרשות אלף ו־20 וידיאו שעות אלף 200 על 3־5 מצטרפים שנה בכל אודיו. שעות

מיליון מסמכים נוספים. ב־ הקמתו מאז ושם, יד של המטרה 1953, היתה לחבר את כל פיסות המידע שנספו היהודים הקורבנות זיכרון של לאסוף הכל: תצ־ ולצורך כך בשואה — לומים, חפצים, סרטים, ניירות, עדויות,

נעשה האחרונות בשנים הכל. שמות. היס־ מידה בקנה שאפתני, מאמץ שם כל את דיגיטלי לפורמט להמיר טורי, העדויות, המסמכים והתיעודים של קו־ארכיון "אין הם. באשר השואה רבנות בעולם שמנסה להתמודד באופן יזום עם מדגיש הכל", של הוליסטית, דיגיטציה ד"ר חיים גרטנר, מנהל אגף הארכיונים

ביד ושם.

שכבה על שכבההדיגי־ של העיקריות המטרות אחת טציה הזו, מעבר למטרות השימור לטווח הארוך, היא ההנגשה לקהל הרחב. עם הש־

נים הבינו ביד ושם את החשיבות העצומה של הנגישות לארכיון המאוחסן באינטרנט, בפורמט שניתן לקטלג ולחפש בו. "מספר המבקרים ביד ושם מתגמד לעומת כמות דרך למידע לגשת שיכולים האנשים

אגף מנהל ליבר, מיכאל מסביר הרשת", מערכות המידע. "המידע צריך היה להפוך לנגיש לקהל הרחב", הוא מוסיף — ומת־כוון בעצם למה שקיים סביבנו כבר שנים

— מאינטרנט ועד טלפונים חכמים.מפעל שנים שלוש לפני החל וכך הבסיס ושם. יד של הפנימי הדיגיטציה קור־ של השמות מאגר קיים: היה כבר

בנות השמות הועלה לאינטרנט ב־2004, של שמות מיליון 4.2 היום מכיל וכבר מסביר שם", נגמר לא "זה קורבנות. תיק אדם לכל יוצרים "אנחנו גרטנר. לבנות היא כשהמטרה אישי, וירטואלי שכבה נוספת מעל מאגר השמות, לקבץ הפרי־ כל את אחד, למקום וירטואלית, טים שיש לנו ברחבי יד ושם, צילומים, מסמכים, עדויות ואפילו חפצים פיזיים.

הכל תחת השם של הקורבן".ביד ושם סורקים באופן שיטתי את כל התיעוד הקיים. בשנה שעברה מדובר היה

שילוב הזוי כל�כך, בין פריטים ארכיוניים היסטוריים לבין הטכנולוגיה המתקדמת בעולם, כולל פייסבוק, אפשר למצוא

כנראה רק ביד ושם † גם גוגל גויסה למשימת ההנצחה, ומיליוני מסמכים, תצלומים ושעות וידאו כבר עברו למתכונת דיגיטלית

משחק מכור

המשחק המלווה את Expendables 2 של סטלונה מנסה להיות נוסטלגי אבל מצליח רק להיות שטחי ומשעמם

Tape-a-talk Voice Recorder :הקלטההקלטת קול באיכות גבוהה. ניתן להקליט גם כשצג

המכשיר כבוי, לבחור בין הקלטה באיכות גבוהה לאיכות נמוכה, להפוך את ההקלטה לרינגטון ועוד איד

דרואנ

8

הדי בירן

Golf 3D :לא רק לאריסטוקרטיםמשחק גולף תלת ממדי ומלהיב. למרות פשטותו תוכלו למצוא כאן אתגרים לא

קלים, ולהתמכר מרצון

משרדי ה�IT ביד ושם. לכל יש גיבוי

לא בלתי נשכחים

לסדרת צופים למשוך כדי סרטי "בלתי נשכחים" שלו, שה־למסכים מגיע שלה השני פרק סילבסטר מסתמך אלו, בימים הנוסטלגיה תחושת על סטלונה פעם". של "כמו פעולה לסרטי המ־ ,Expendables 2 מפתחי שחק הרשמי של הסרט, בנו אותו מתחום אבל מקביל, רעיון על מתגעגעים אנשים הגיימינג: פעם, של פעולה לסרטי רק לא של פעולה למשחקי גם אלא מעט לא של והצלחתם — פעם האחרונות בשנים רטרו משחקי משחק ניצור אם זאת. מוכיחה "בלתי נשכחים 2", שייראה פחות או יותר כמו משחק מודרני אבל מסוף פעולה משחק כמו יעבוד שנות השמונים, בוודאי נקלע בול

לקהל היעד, אמרו לעצמם.טוב, היה אולי הכללי הרעיון לשדרג ניסו אפילו והמפתחים במאפייני הקלאסית הנוסחה את משחק מודרניים — אבל מה הטעם לא כשעוד לעוגה קצפת להוסיף למדת איך לאפות לה בסיס מוצק?אמו־ במשחק ההתרחשויות רות להוות פרולוג לסרט, אבל הן בעיקר איפשרו לצמצם את אוסף הגיבורים־סלבריטאים של הסרט שהשחקן בלי בלבד, לארבעה ישאל את עצמו לאן נעלמו השאר. נלחמות שכולן הדמויות, ארבע דרך 20 שלבי המשחק ביחד — כך על־ נשלטות האחרות שהשלוש אוטומ־ או אחרים שחקנים ידי אלו הן — המחשב על־ידי טית דולף עצמו, סטלונה שמגלמים לונגדרן, ג'ט לי וטרי קרוז. תש־כחו מהאחרים. אבל אתם יודעים מה? זה לא משנה, כי מלבד מספר שהן קרב ססמאות של גדול לא צועקות ותנועת חיסול אופיינית, לא טרחו המפתחים להעניק אופי מעניין לדמויות, או להבדיל בי־ניהן משמעותית. שיחקתם אחת,

שיחקתם את כולן.גם בלי היכולת לבנות צוותים מספר המשחק את ולחוות שונים פעמים, כל פעם כדמות עם סגנון Expendables 2 שונה, לחימה עדיין היה אמור להיות כיף, באותו פורמט ממנו נהנינו במשחקי המ־

רצים הארבעה פעם. של כונות דרך השלבים, מוצגים מזווית שבין מבט על למבט צד, ומחסלים אלפי הבעיה פוסק. בלתי ביירי אויבים היא, שהמשחק מפספס לגמרי את העקרונות שהופכים משחק יריות התחלה, בתור לטוב. כזה פשוט מדויק באופן שלכם הירי כיוון קשה, ולמרבה הצער גם לא נחוץ וכבר ההתקדמות לכיוון רססו —תפגעו במשהו. שנית, לאלפי הק־

ליעים שתשגרו אין משמעות: הם ובאויבים הסביבה בתוך נספגים ללא השפעה ניכרת לעין, עד שב־הנזק נופל. האויב דבר של סופו של והרגשה מינימלי, הסביבתי

כוח או מסה נעדרת לחלוטין.שתי הבעיות הללו קשות מס־את גם יש להן מעבר אבל פיק, עניין האויבים, שתוקפים ללא קצב וסגנון, ללא דפוסי התקפה שהש־וגורמים ולנצל, ללמוד צריך חקן כלואים להרגיש המשחק לשלבי פחות או יותר באותה סצינה לכל אורכם, מלבד הנוף המשתנה. על הזה הלא־מספק המשחקיות בסיס כמו זמננו, בנות תוספות נמרחו שידרוג ומנגנון מחסה תפיסת לא כמעט אלה אבל — דמויות ה"בלתי את ומשאירים מורגשים, משחק, של בסטטוס "2 נשכחים שלא רק תשכחו מייד לאחר סיומו, אלא רוב הסיכויים שתרצו לשכוח

עוד לפני כן.

Expendables 2: The Videogame

עבור פלייסטיישן 3, Xbox 360, PC

מחיר: 15 דולרים (לרכישה ברשת)

לרכישה למחשב:EXP2/–gamersgate.com/DD vidoegame–2–expendables

SIGTRS - Vol. 19 Num 2 - 12/2012 51

Page 53: sigtrs vol 19 num 2

מחבריםי "עפ) 2כולל חוברת (' טעד י' אינדקס לכרכים א __________________________________________________

SIGTRS - Vol. 19 Num 2 - 12/2012 52

Page 54: sigtrs vol 19 num 2

1

) 2חוברת 'יטעד כרך ' כרך א(אינדקס לפי שם מחבר

גליון כרך שם המחבר המאמרשם . מס

תאריך

XML 6/2000 2 ' ו אבגי ראובן והשלכותיו על בסיסי נתונים ואחזור טקסט

1/2003 1 'ט אבגי ראובן גרסה חדשה - Inter Textמנוע האחזור

1/2003 1 'ט בגי ראובןא Inter Textתכונות מנוע החיפוש

5/1999 2 ' האבולוף אוריאל החפשן של סנונית 6/2003 2 'ט אברהם אלכס טיפול בנושא השמות ביד ושם

Yad Vashem names and places index 6/2003 2 'ט אברהם אלכס אדלשטיין קוביחיפוש מידע ברשת

טל רפפורט 1/2002 1 'ח

פשרת להרכיב את הפאזל הטכנולוגיה הישראלית שמא היהודי

6/2012 1 'יט אדרת עופר

אופיר עידיתמנוע חיפוש וניהול ידע בעברית זהבי יורם

6/2002 2 'ח

אופק נועהSQLהמרת שאילתות בשפה טבעית לשאילתות עפרי דר

1/2005 1 'יא

Full Txet - 1/2001 1 ' ז אורון שחר מנוע חיפוש בעברית 6/2005 2 'יא אורנן עוזיקסטים עברייםמנוע חיפוש בט

1/2006 1 'יב אורנן עוזי ניאוזאורוס -תכונות מנוע האחזור 1/2006 1 'יב אורנן עוזי מנוע חיפוש וניהול מימדים -ניאוזאורוס

1/2007 1 'יג אורנן עוזיממנוע חיפוש לשלטי דרכים 6/2007 2 'יג וזיאורנן ע' פרופ מבנה המילה והשתקפותו בניקוד ובתעתיק

GUIdance : כלי ליצירת ממשק גרפי למערכתMF 10/1995 2 ' אאורנשטיין דרור

5/1996 1 ' ב אחיטוב שמיר בחינת מודל ללמידה דרך הייפרטקסט 5/1996 1 ' ב אלגום אורי ל ומערכת הבטחון "ארכיון צה

6/2009 2 'ב אליאסי אמיר שרות החיפוש של גוגל 2/1997 1 ' ג אמיתי יעל כלים לביצוע מחקר איטרטיבי

אנדלמן נחמה RetrievalWareמנוע החיפוש צבי קמר

6/2003 2 'ט

6/2012 1 'יט אפשטיין יכין' דר הגניזה הקהירית ממשיכה לספק כותרות 6/2004 2 'י ארד איריס ייצור אוטומטי של תיזאורי ומילונים דו לשוניים

סגמנטציה ומבנה קואורדינטות במערכת ,מטריקה אחזור טקסט

1/2006 1 'יב ארד איריס

1/2007 1 'יג ארד רינה שימוש באונטולוגיות לניהול וארגון מידעפיתוח מערכת טקסטואלית תומכת החלטה בסביבה

מרובת פלטפורמות 1/2001 1 ' ז אריאלי אהוד

12/2012 2 'יט דוגין ליזהבו סיכום מפגש שולחן עגול, חיפוש ארגוני 1/2012 2 'יח בלומקין נמרוד ניהול ידע בחקירות

5/1999 2 ' הבנחקון אלינור Medline -השוואת מערכות חיפוש של המאגר ה 6/2003 2 'ט בן אהרון דביר חבילת מוצרים לניתוח ואחזור שמות

אילן -בר' דריציבות מידע ברשת יהודית

6/2000 2 ' ו

1/2004 1 'י ברדוש יוסי ארכיון הכתבות הדיגיטליות בידיעות אחרונות 1/2009 1 'טו בר סימן טוב פני אחזור קבצי מוזיקה ואודיו באינטרנט

10/1995 2 ' א גור אלי ממשק שפה טבעית בעברית למסכי נתונים יחסיים 2/1998 1 ' ד גוראון רן היפרטקסט וקבלת החלטות

1/2005 1 'יא גיורא שמעוני חופשי בטקסטים סרוקים בעברית חיפוש 1/2008 1 'יד גיורא שמעוני מורפולוגיה למנועי חיפוש

12/2012 2 'יט גיורא שמעוני במאגר פסקי דין GSAישום

6/2002 2 'ח גיל תומר השוואה של מנועי חיפוש בעברית 5/1998 2 ' ד גילעד זוהר פתרונות לאבטחת איכות תוכנה

פתוח ביישומי -שימוש בטכנולוגיות מבוססות קוד" "טקסט-אחזור

גליבוב ליאוניד ויוסיפון אורן

1/2011 1 'יז

7/1997 2 ' גגליקשטיין טליה Push - טכנולוגיית ה 1/2009 1 'טו גרינברג זאב איך מחפשים ומוצאים - מיומנו של מחפש עצמאי

RexyGo 1/2010 1 'טז יוסי דבש מנוע חיפוש חדש

SIGTRS - Vol. 19 Num 2 - 12/2012 53

Page 55: sigtrs vol 19 num 2

2

) 2חוברת ' טיעד כרך ' כרך א(אינדקס לפי שם מחבר המשך

גליון כרך שם המחבר המאמרשם . מס

תאריך

6/2007 2 'יג דגן עידו' דר הבנת שפה ביישומי טקסטים 2/1997 1 ' ג דננברג אמיר הוצאה לאור אלקטרונית

HPב למחש WANGל ממחשב "הסבת ארכיון צה UNIXתחת

2/1998 1 'ד דננברג בני

4/1995 1 ' א דרורי עפר ין יחדשות מקבוצת הענ 10/1995 2 ' א

5/1996 1 ' ב

11/1996 2 ' ב

2/1997 1 ' ג

7/1997 2 ' ג 3/1998 1 ' ד

5/1998 2 ' ד 1/1999 1 ' ה

5/1999 2 ' ה 1/2000 1 ' ו

6/2000 2 ' ו 1/2001 1 ' ז

6/2001 2 'ז 1/2002 1 'ח 6/2002 2 'ח 1/2003 1 'ט 6/2003 2 'ט 1/2004 1 'י 6/2004 2 'י 1/2005 1 'יא 6/2005 2 'יא 1/2006 1 'יב 6/2006 2 'יב 1/2007 1 'יג 6/2007 2 'יג 1/2008 1 'יד 6/2008 2 'יד 1/2009 1 'טו 6/2009 2 'טו 1/2010 1 'טז 6/2010 2 'טז 1/2011 1 'יז 7/2011 1 ' יח 1/2012 2 'יח 6/2012 1 'יט 12/2012 2 'יט

7/2011 1 'יח דרורי עפר ימייל'איך לצמצם את שטח האחסון בדואר גלקטרוני עם תכונות חיפוש כיצד לייצר ספר א

Adobe Acrobatבאמצעות 1/2005 1 'יא דרורי עפר

הצגת תוצאות חיפוש במערכות אחזור מידע תוך מחקר -שימוש באלמנטים שונים לייצוג המסמכים

שימוש

1/2005 1 'יא דרורי עפר

5/1999 2 ' ה דרורי עפר מידע גדולים -בניית מאגרי 4/1995 1 ' א דרורי עפר ם "מידע טקסטואלי בשע ישום מערכת איחזור

2/1997 1 ' ג דרורי עפר מנועי חיפוש באינטרנט 5/1996 1 ' ב דרורי עפר ניהול וארגון קבוצת ענין

1/1999 1 ' ה דרורי עפר עיצוב ממשק משתמש במערכות מידע

SIGTRS - Vol. 19 Num 2 - 12/2012 54

Page 56: sigtrs vol 19 num 2

3

) 2חוברת ' טיעד כרך ' כרך א(אינדקס לפי שם מחבר המשך

גליון כרך שם המחבר המאמרשם . מס

תאריך

שילוב מערכות אחזור טקסט ומערכות מידע קונבנציונליות

7/1997 2 ' ג דרורי עפר

הצגת תוצאת חיפוש בממשק משתמש במערכות אחזור סקירת ספרות -טקסט

1/2000 1 ' ו דרורי עפר

6/2000 2 'ן דרורי עפר הוספת מנוע אחזור לאתר אינטרנט 1/2001 1 ' ז דרורי עפר קריטריונים להשוואה בין מנועי חיפוש

מידע באתר -שילוב בסיסי נתונים ומאגרי בספריה ובמרכזי מידע WEB -ה

6/2001 2 'ז דרורי עפר

מידע באתר -שילוב בסיסי נתונים ומאגרי בספריה ובמרכזי מידע WEB -ה

1/2002 1 'ח דרורי עפר

6/2002 1 'ח דרורי עפררשימת ספקים -מנועי חיפוש בעברית 1/2003 1 'ט דרורי עפר )11.2002(רשימת ספקים של מנועי אחזור בעברית

1/2003 1 'ט דרורי עפרשימוש במילים נפוצות במסמך לאיתור נושא המסמך 1/2003 1 'ט דרורי עפר תכונות נדרשות - ניהול תוכן 1/2003 1 'ט דרורי עפר 2גירסה -לבחירת מנוע אחזור טקסט קריטריונים

6/2003 2 'ט דרורי עפרמנוע חיפוש לשפה העברית רשימת ספקים למנועי אחזור בעברית

)3.2003גירסה ( 6/2003 2 ט דרורי עפר

רשימת ספקים - מנועי אחזור טקסט בעברית )3.2004גירסה (

6/2004 2 'י דרורי עפר

רשימת ספקים - חזור טקסט בעברית מנועי א )4.2005גירסה (

6/2005 2 'יא דרורי עפר

רשימת ספקים - מנועי אחזור טקסט בעברית )06.2006גירסה (

1/2007 1 'יג דרורי עפר

רשימת ספקים - מנועי אחזור טקסט בעברית )07.2009גירסה (

1/2010 1 'טז דרורי עפר

ימת ספקיםרש - מנועי אחזור טקסט בעברית )10.2010גירסה (

1/2011 1 'יז דרורי עפר

6/2004 2 'י דרורי עפר3גירסה -קריטריונים לבחירת מנוע אחזור טקסט איתור נושא מסמך בצורה אוטומטית תוך שימוש

במילים נפוצות 6/2004 2 'י דרורי עפר

6/2005 2 'יא דרורי עפר שיקולים בבחירת מערכת לניהול תוכן 1/2006 1 'יב דרורי עפר 4גירסה -ריונים לבחירת מנוע אחזור טקסט קריט

6/2006 2 'יב דרורי עפר ממצאי מחקר -דירוג רשימת תוצאות חיפוש 1/2009 1 'טו דרורי עפר שרות אחזור טקסט של גוגל

1/2010 1 'טז דרורי עפר ATTIVIOתכונות מנוע החיפוש

1/2010 1 'טז י עפרדרור RexyGoתכונות מנוע החיפוש

1/2010 1 'טז דרורי עפר Fastתכונות מנוע החיפוש

6/2010 2 'טז דרורי עפר XRSתכונות מנוע החיפוש

Inter Text 2/1998 1 'ד הוך איציק 5/1998 2 ' ד הוך איציק נט - מערכת נוהלים בטכנולוגיית אינטרה

11/1996 2 ' בהנדזל רות 'דרסיכום מצב קיים במערכות אחזור טקסט מרקוס ' דר חברי הכנסת כצרכני מידע

רבקה 12/2012 2 'יט

הרשברג נמרוד עיבוד שפה טבעית בערבית כפיר בר

1/2008 1 'יד

5/1998 2 ' דווידנפלד צביקה WEB -עיצוב ממשק משתמש ל

4/1995 1 ' א וייזל גלעד TQLכיווני פיתוח באחזור טקסט 1/2006 1 'יב וינהבר אורי חיפוש מידע מבוסס ניתוח טקסט 6/2007 2 'יג ולן אינגריד' דר ניתוח שאילתות באתרי מכירות

מחשוב המתווה הלקסיקוגרפי של השפה העברית בת זמננו

דור - זיסמן בן שירה

;6/2005 2 'יא

זמיר אורן ממשקים ויזואלים לתוצאות חיפוש עציוני אורן

1/2000 1 'ו

6/2001 2 'ז זמיר אורן ויזואליזציה של תוצאות חיפוש במערכות אחזור מידע

Advisor - 6/2009 2 'טו חברת סלסנס כלי ליצירת יישומי שפה טבעית

SIGTRS - Vol. 19 Num 2 - 12/2012 55

Page 57: sigtrs vol 19 num 2

4

) 2חוברת ' טיעד כרך ' כרך א(אינדקס לפי שם מחבר המשך

גליון כרך שם המחבר המאמרשם . מס

תאריך

6/2006 2 'טו חגיז מוטי טנדרטיים במערכות ומוצרים קיימיםכלי חיפוש ס

3.0 Web טכנולוגיות סמנטיות -מעבר לפינה באינטרנט ובארגונים

6/2010 2 'טז חזקיה רוני

4/1995 1 ' א ר חנני אורי "ד expetrextמגמות עתידיות בעולם איחזור המידע

6/2003 2 'ט ר חנני אורי"ד MindCite -מנתונים לידע

1/2000 1 'ו חן בועז זיהוי תמידי של מידע ברשת האינטרנט ויזואליזציה של מידע בהתבסס על קשרים מובנים

וניתוחם 6/2010 2 'טז חרדק פבל

6/2000 2 ' ו טיוטו מרק יין ואינטרנט הדור הבא של רשתות ": הרתחת אוקיינוס האינטרנט"

חברתיות 6/2010 2 'טז ר יהודה יאיר"ד

פתוח ביישומי -שימוש בטכנולוגיות מבוססות קוד" טקסט-אחזור

1/2011 1 'יז יוסיפון אורן

6/2009 2 'טו צחי יעקובוביץ ATTIVIOהשוואת מנועי חיפוש ומנוע

יפת אביבה מערכת לאיתור ישויות דרורי עפר

1/2004 1 'י

7/2011 1 'יח ירדני ירדן ?כיצד, מחקר בתיק דיגיטאלי בבתי המשפט

Fast -ושימוש ב OCR - הטכנולוגיה של אוליב ל לאחזור מסמכי בתי משפט

1/2012 2 'יח ירדני ירדן

1/2003 1 'ט ירדני לאורה תכונות מנוע החיפוש מורפיקס 1/2004 1 'י ירדני לאורה הבעיה והפתרון -חיפוש טקסט מלא בעברית ובערבית

1/2003 1 'ט כהן אייל D2K.NETתכונות מוצר לניהול הידע

1/2002 1 'ח כהן חנן עקרונות ודוגמאות, חיפוש תלוי הקשר 12/2012 2 'יט כהן שגיא זכרון לטווח רחוק

1/2002 1 'ח לבנה משה אחזור מסמכים משובשים

MKnowledge - 1/2011 1 'יז לוי ניר ניתוח והצגה של ידע, תוכנה לקבלה

-ני במיקרוסופטמפת הדרכים של החיפוש הארגוMOSS

1/2010 1 'טז לוסטיג רונה

הנגשת ארכיונים לציבור הרחב באמצעות דוגמאות מיד ושם

6/2009 2 'טו ליבר מיכאל

כלים לניתוח טקסט בעברית ובשפות ? זה נשמע סינית" "אחרות

ליטוב דוד אנדרו גולדמן

1/2011 1 'יז

6/2003 2 'ט ליס אורלי המרת אתרים מעברית ויזואלית ללוגית 6/2002 2 'ח לסט מרק' דר ארגון תוצאות חיפוש ממנועי אחזור באינטרנט

כולל (סיווג אוטומטי של מסמכי טקסט בשפות שונות )ערבית

1/2007 1 'יג לסט מרק' דר

מבשב ישראלממשק חלונאי אחד לטקסטים בסביבות עבודה שונות טל כוכבה

1/2001 1 ' ז

1/2011 1 'יז מודן דורון תרגום מכונה וזיהוי דיבור, שבמבוא לדיבור ממוח 1/2003 1 'ט מידן אברהם WizDocתכונות מנוע החיפוש

WizDoc - מנוע חיפוש לפי משמעויות בעברית ובאנגלית

6/2003 2 'ט מידן אברהם

1/2008 1 'יד מידן אברהם ' דר חיפוש לפי משמעויות

6/2003 2 'ט וני אלוןמימ Fast תכונות מנוע החיפוש

6/2003 2 'ט מימוני אלון Fast Searchארכיטקטורה של מנוע החיפוש

7/2011 1 'יח מימון עודד' פרופ כריית מידעהשוואה בין מימושים שונים של מורפולוגיה עברית

ביישומי אחזור מידע טקסטואלי 6/2004 2 'י מרגלית אפרים

NanoSyntax - שפה טבעית גישה חדשנית להבנת ביישומי מחשב

6/2007 2 'יג מרגליות ששון

י טקסנומיה "הצגת תוצאות חיפוש מקובצת עפ LCC&Kארגונית בשילוב מנשק

6/2007 2 'יג מרדכי ויקי

SIGTRS - Vol. 19 Num 2 - 12/2012 56

Page 58: sigtrs vol 19 num 2

5

)2חוברת ' טיעד כרך ' כרך א(אינדקס לפי שם מחבר המשך

גליון כרך שם המחבר המאמרשם . מס

תאריך

י "צת של תוצאות חיפוש עפהצגת תוצאות מקוב LCCKטקסונומיה ארגונית בהתבסס על ממשק

מרדכי ויקי דרורי עפר

אריאל פרנק

1/2008 1 'יד

חברי הכנסת כצרכני "תקציר מעבודת מחקר בנושא "מידע

וס קמר' דר רבקה

1/2012 2 'יח

11/1996 2 ' ב סגל בני מאגרי מידע משולבים טקסט ומידע חזותי 1/1999 1 ' ה סימסולו יניב ך למנועי חיפוש ברשת האינטרנט המדרי

, אתגרים. לראשונה בקוד פתוח: חיפוש עברי" "והתמודדויות אחרות, פתרונות

הרשקו -סין איתמר

1/2011 1 'יז

סלייטר זיו עידון תהליכי חיפוש במאגרי מידע והצגתם למשתמש עזרא רחל- חי

6/2004 2 'י

1/2009 1 'טו עידן אורי W3C - ה סמנטיק ווב וארגון

מוזיאונים משקיעים : הרשת עושה היסטוריה מיליונים במעבר לפורמט דיגיטלי

6/2012 1 'יט עילם הראל

TDNet searcher analyzer 1/2006 1 'יב עפרון משה 6/2012 1 'יט ערמון שחר זיהוי טקסט וחיפוש בכתבי יד עבריים הסטורים

1/2002 1 'ח פישל אריק מנועי חיפושניצול אופטימלי של 7/2011 1 'יח פישל אריק אחזור מידע פרלמנטארי מקבצי וידאו

באתר השאלות והתשובות מהגדולים IR - שימושים ב בעולם

6/2009 2 'טו פיינשטיין יובל

6/2012 1 'יט פלבינסקי מאיר מגמות בזיהוי כתב יד 12/2012 2 'יט פלבינסקי מאיר מחשוב ארכיונים

1/1999 1 'ה פלמון ערןמנוע חיפוש עברי במסדי נתונים מובנים 5/1996 1 'ב פריימן שלמה אינטרנט

ההתפתחות המקבילה של מנועי חיפוש וספריות דיגיטליות

פרנק אריאל חנני אורי

6/2001 2 'ז

12/2012 2 'יט פרנקל אסף SQLמנוע החיפוש של

6/2003 2 'ט קל עפרהפרנ Flairתכונות מנוע החיפוש

ההמצאה הכי שימושית שהומצאה אי - מגלה סרקזם פעם

7/2011 1 'יח צור אורן

10/1995 2 ' א צור מיכל הרעיון ושימושיו במערכות אחזור טקסט ,תזאורוסמנוע חיפוש כתשתית לאוטומציה של תהליכים ידניים

במאגרים טקסטואליים 1/1999 1 ' ה קולקו מיקי

1/2003 1 'ט קולקו מיקי XRSתכונות מנוע החיפוש

1/2004 1 'י קולקו מיקי PowerMatcherאחזור טקסט בשמות באמצעות 6/2010 2 'טז קולקו מיקי מנוע לזיהוי ישויות

6/2005 2 'יא קולקו מיקי 2001מנוע לניתוח קשרים של חברת 6/2004 2 'י קמיר דרור אחזור מידע ומורפולוגיה של השפה הערבית

1/2010 1 'טז קסל תמיר Fast -מפת הדרכים של החיפוש הארגוני במיקרוסופט

קרימולובסקי ניתוח יובל

6/2007 2 'יג

, רגב יזהר מערכת מודולרית לכריית מידע מטקסט, מאיה גורודצקי

רונן פלדמן

1/2006 1 'יב

A Modular Information Extraction System רגב יזהר , , מאיה גורודצקי

רונן פלדמן

1/2006 1 'יב

:מיפתוח אוטומטי מול מיפתוח ידני בסביבה משרדית בחינה השוואתית

1/2007 1 'יג רוזנברג תמי

5/1999 2 ' ה רוזן יונתן למה כל כך קשה לכתוב בעברית 5/1999 2 ' ה רוזן יונתן לוח המפתחות העברי

5/1999 2 ' ה רוזן יונתן בריות ערכים מספריים לאותיות עTRS - המרכיבים השונים של -מאחורי הקלעים

המערכת והיישומים האפשרים בה 10/1995 2 ' א רוזן פטר

1/2009 1 'טו רזניקוב אלעד חיפוש באמצעות קלסיפיקציה של מידע

6/2002 2 'ח ריפתין אביב DTSearch - טכנולוגיות ה

SIGTRS - Vol. 19 Num 2 - 12/2012 57

Page 59: sigtrs vol 19 num 2

6

) 2חוברת 'טיעד כרך ' כרך א(פי שם מחבר אינדקס להמשך

כר שם המחבר המאמרשם ך

גליון . מס

תאריך

תגיות לשיפור וייעול הופעת אתרים -שימוש במטה במנועי חיפוש

רפפורט טל רשתי דודו

1/2002 1 'ח

רפפורט טל ניהול ידע רשתי דודו

1/2002 1 'ח

5/1999 2 ' ה רשתי דודו עברית ברשת רשתי דודו HTMLדגשים בנוגע לשילוב עברית במסמכי

ירחי איציק 5/1999 2 ' ה

הפקת מידע מתמונות דיגיטליות של קטעי הגניזה וזיהוי צירופים בין הקטעים

6/2012 1 'יט שויקה רוני' דר

6/2005 2 'יא שויקה יעקב' פרופ ?ומדוע -האם עיבוד שפות טבעיות הוא מסובך 6/2005 2 'יא שויקה יעקב' פרופ בפיתוח מנועי חיפוש בעברית המורכבות

מחשוב כתבי , מסמטאות קהיר לאינטרנט המהיר היד וזיהוי צירופים בין הקטעים

6/2012 1 יט שויקה יעקב' פרופ

1/2000 1 'ו שוק אדם אחזור מידע ומנועי חיפוש

Contex - 1/2006 1 'יב שושני יניב מוצר לניהול תוכן

7/1997 2 ' ג שטרן יוני אחזור מידע המבוסס על תוכן תמונות במסמך 1/2004 1 'י שמחוני אלה ספריה דיגיטלית -ניהול תוכן במשרד במקר המדינה

7/2011 1 'יח שמיר דן חשים ומכניסים הגיון לאינטרנט-חוכמת האינטרנט 1/2009 1 'טו שמעוני עינת מנועי חיפוש ארגוניים

12/2012 2 'יט שמעוני גיורא במאגר פסקי דין GSA ישום

1/2010 1 'טז שמעוני עינת בפרויקטי ניהול ידע Web 2.0שילוב מודלים של

לצורך ניהול Web 2.0רשמים משולחן עגול בנושא ידע ארגוני

1/2010 1 'טז שמעוני עינת

11/1996 2 ' ב שפירא ברכה סינון מידע בטכניקות מתקדמות

6/2001 2 'ז שפירא ברכה Antworld - כלי לחיפוש שיתופי באינטרנט

1/2004 1 'י שפירא ברכה של תוכן) פרסונליזציה(שיטות להתאמה אישית 6/2007 2 'יגשפירא ברכה ' דר מנוע חיפוש שיתופי מבוסס מודל כלכלי

XML - 6/2001 2 'ז שרוטר גרט המסלול המהיר לכלכלה החדשה

1/2007 1 'יג שרון טלי את המיטב Google - וציא מכיצד לה

1/1999 1 ' ה שרון יוחאי כלים לחיפוש מתקדם ברשת האינטרנט 1/2005 1 'יא שרון יוחאי מנוע אחזור באתר מוזיאון המדע בירושלים

5/1998 2 ' ד שריג עידא בדיקת תוכנה נתמכת מחשב Information Retrieval Interaction Ingwersen peter 6/2003 2 'ט

Information Retrieval C.J. van RIJSBERGEN

6/2003 2 'ט

תרגום חופשי, מבוא - 1פרק , אחזור מידע C.J. van RIJSBERGENמהספר של

C.J. van RIJSBERGEN

6/2005 2 'יא

תרגום , ניתוח טקסט אוטומטי - 2פרק , אחזור מידע חופשי

C.J. van RIJSBERGENמהספר של

C.J. van RIJSBERGEN

6/2005 2 'יא

תרגום חופשי, סיווג אוטומטי - 3פרק , אחזור מידע C.J. van RIJSBERGENמהספר של

C.J. van RIJSBERGEN

1/2006 1 'יב

תרגום חופשי, מבנה קבצים - 4פרק , אחזור מידע C.J. van RIJSBERGENמהספר של

C.J. van RIJSBERGEN

1/2006 1 'יב

תרגום , אחזור הסתברותי - 6פרק , אחזור מידע C.J. van RIJSBERGENחופשי מהספר של

C.J. van RIJSBERGEN

6/2006 2 'יב

תרגום חופשי, הערכה - 7פרק , אחזור מידע C.J. van RIJSBERGENמהספר של

C.J. van RIJSBERGEN

1/2007 1 'יג

גום חופשיתר, סיכום - 8פרק , אחזור מידע C.J. van RIJSBERGENמהספר של

C.J. van RIJSBERGEN

1/2007 1 'יג

 

SIGTRS - Vol. 19 Num 2 - 12/2012 58

Page 60: sigtrs vol 19 num 2

כותריםי "עפ) 2כולל חוברת (' טעד י' אינדקס לכרכים א __________________________________________________

SIGTRS - Vol. 19 Num 2 - 12/2012 59

Page 61: sigtrs vol 19 num 2

1

)2חוברת ' טיעד כרך ' אכרך (אינדקס לפי שם מאמר

גליון כרך שם המחבר שם המאמר

.מס תאריך

1/2004 1 'י מטה גרופ אבני בניין לניהול ידע 1/2004 1 'י מיקי קולקו PowerMatcherאחזור טקסט בשמות באמצעות

יוני שטרן אחזור מידע המבוסס על תוכן תמונות במסמך אבי עזרא

7/1997 2 'ג

6/2004 2 'י דרור קמיר אחזור מידע ומורפולוגיה של השפה הערבית 1/2000 1 'ו אדם שוק אחזור מידע ומנועי חיפוש

7/2011 1 'חי אריק פישל אחזור מידע פרלמנטארי מקבצי וידאותרגום חופשי מהספר , מבוא - 1פרק , אחזור מידע

C.J. van RIJSBERGENשל C.J. van

RIJSBERGEN

6/2005 2 'יא

תרגום , ניתוח טקסט אוטומטי - 2פרק , אחזור מידע C.J. van RIJSBERGENחופשי מהספר של

C.J. van RIJSBERGEN

6/2005 2 'יא

תרגום חופשי , סיווג אוטומטי - 3פרק , אחזור מידע C.J. van RIJSBERGENמהספר של

C.J. van RIJSBERGEN

1/2006 1 'יב

תרגום חופשי , מבנה קבצים - 4ק פר, אחזור מידע C.J. van RIJSBERGENמהספר של

C.J. van RIJSBERGEN

1/2006 1 'יב

תרגום , אסטרטגיות חיפוש - 5פרק , אחזור מידע C.J. van RIJSBERGENחופשי מהספר של

C.J. van RIJSBERGEN

6/2006 2 'יב

תרגום , אחזור הסתברותי - 6פרק , אחזור מידע C.J. van RIJSBERGENפר של חופשי מהס

C.J. van RIJSBERGEN

6/2006 2 'יב

תרגום, הערכה - 7פרק , אחזור מידע C.J. van RIJSBERGENחופשי מהספר של

C.J. van RIJSBERGEN

1/2007 1 'יג

תרגום, סיכום - 8פרק , אחזור מידע C.J. van RIJSBERGENחופשי מהספר של

C.J. van RIJSBERGEN

1/2007 1 'יג

1/2002 1 'ח משה לבנה אחזור מסמכים משובשים 1/2009 1 'טו פני בר סמן טוב אחזור קבצי מוזיקה ואודיו באינטרנט 7/2011 1 'יח עפר דרורי ימייל'איך לצמצם את שטח האחסון בדואר ג

5/1996 1 'ב שלמה פריימן אינטרנטאיתור נושא מסמך בצורה אוטומטית תוך שימוש

נפוצות במילים 6/2004 2 'י עפר דרורי

6/2002 2 'ח ר מרק לסט"ד ארגון תוצאות חיפוש ממנועי אחזור באינטרנט 1/2004 1 'י יוסי ברדוש ארכיון הכתבות הדיגיטליות בידיעות אחרונות

5/1996 1 'ב אורי אלגום ל ומערכת הבטחון"ארכיון צה 6/2003 2 'ט ימוניאלון מ Fast Searchארכיטקטורה של מנוע החיפוש 5/1998 2 'ד עידא שריג בדיקת תוכנה נתמכת מחשב

5/1996 1 'ב שמיר אחיטוב בחינת מודל ללמידה דרך הייפרטקסט 5/1999 2 'ה עפר דרורי מידע גדולים-בניית מאגרי

דודו רשתי HTMLדגשים בנוגע לשילוב עברית במסמכי איציק ירחי

5/1999 2 'ה

6/2006 2 'ב עפר דרורי ממצאי מחקר -ות חיפוש דירוג רשימת תוצא 6/2005 2 'יא יעקב שויקה ?ומדוע -האם עיבוד שפות טבעיות הוא מסובך

6/2007 2 'יג ר עידו דגן"ד הבנת שפה ביישומי טקסטים 6/2012 1 'טו יכין אפשטיין' דר הגניזה הקהירית ממשיכה לספק כותרות

פוש וספריות ההתפתחות המקבילה של מנועי חי דיגיטליות

פרנק אריאל אורי חנניר "ד

6/2001 2 'ז

6/2000 2 'ו עפר דרורי הוספת מנוע אחזור לאתר אינטרנט 2/1997 1 'ג אמיר דננברג הוצאה לאור אלקטרונית

5/1999 2 'ה אוריאל אבולוף החפשן של סנוניתהטכנולוגיה הישראלית שמאפשרת להרכיב את

הפאזל היהודי 6/2012 1 'יט ר אדרתעופ

Fast -ושימוש ב OCR - הטכנולוגיה של אוליב ל לאחזור מסמכי בתי משפט

1/2012 2 'יח ירדן ירדני

2/1998 1 'ד רן גוראון היפרטקסט וקבלת החלטות 1/1999 1 'ה יניב סימסולו המדריך למנועי חיפוש ברשת האינטרנט 6/2005 2 'יא ויקהיעקב ש המורכבות בפיתוח מנועי חיפוש בעברית 6/2003 2 'ט אורלי ליס המרת אתרים מעברית ויזואלית ללוגית

SIGTRS - Vol. 19 Num 2 - 12/2012 60

Page 62: sigtrs vol 19 num 2

2

)2חוברת ' טיעד כרך ' כרך א(אינדקס לפי שם מאמר המשך

גליון כרך שם המחבר שם המאמר

.מס תאריך

נועה אופק SQLהמרת שאילתות בשפה טבעית לשאילתות עפרי דר

1/2005 1 'יא

יבור הרחב באמצעות דוגמאות הנגשת ארכיונים לצ מיד ושם

6/2009 2 'טו מיכאל ליבר

למחשב WANGל ממחשב "הסבת ארכיון צה HP תחתUNIX

2/1998 1 'ד בני דננברג

הפקת מידע מתמונות דיגיטליות של קטעי הגניזה הקטעים וזיהוי צירופים בין

6/2012 1 'יט רוני שויקה' דר

מש במערכות הצגת תוצאת חיפוש בממשק משת סקירת ספרות -אחזור טקסט

1/2000 1 'ו עפר דרורי

הצגת תוצאות חיפוש במערכות אחזור מידע תוך מחקר -שימוש באלמנטים שונים לייצוג המסמכים

שימוש

1/2005 1 'יא עפר דרורי

י טקסנומיה "הצגת תוצאות חיפוש מקובצת עפ LCC&Kארגונית בשילוב מנשק

6/2007 2 'יג ויקי מרדכי

י "הצגת תוצאות מקובצת של תוצאות חיפוש עפ LCCKטקסונומיה ארגונית בהתבסס על ממשק

ויקי מרדכי עפר דרורי

אריאל פרנק

1/2008 1 'יד

מוזיאונים משקיעים : הרשת עושה היסטוריה דיגיטלי מיליונים במעבר לפורמט

6/2012 1 'יט הראל עילם

הבא של הדור": הרתחת אוקיינוס האינטרנט" רשתות חברתיות

6/2010 2 'טז ר יאיר יהודה"ד

השוואה בין מימושים שונים של מורפולוגיה עברית ביישומי אחזור מידע טקסטואלי

6/2004 2 'י אפרים מרגלית

6/2002 2 'ח תומר גיל השוואה של מנועי חיפוש בעברית 6/2009 2 'טו יעקובוביץצחי ATTIVIOהשוואת מנועי חיפוש ומנוע

5/1999 2 'ה אלינור בנחקון Medline -השוואת מערכות חיפוש של מאגר הויזואליזציה של מידע בהתבסס על קשרים מובנים

וניתוחם 6/2010 2 'טז פבל חרדק

ויזואליזציה של תוצאות חיפוש במערכות אחזור מידע

6/2001 2 'ז זמיר אורן

כלים לניתוח טקסט בעברית ? זה נשמע סינית" "ובשפות אחרות

דוד ליטוב אנדרו גולדמן

1/2011 1 'יז

6/2012 1 'יט שחר ערמון זיהוי טקסט וחיפוש בכתבי יד עבריים הסטורים 1/2000 1 'ו בועז חן זיהוי תמידי של מידע ברשת האינטרנט

12/2012 2 'יט שגיא כהן זכרון לטווח רחוק 6/2003 2 'ט וןדביר בן אהר חבילת מוצרים לניתוח ואחזור שמות

רבקה ' דר חברי הכנסת כצרכני מידע מרקוס

12/2012 2 'יט

4/1995 1 'א עפר דרורי חדשות מקבוצת הענין 10/1995 2 'א 5/1996 1 'ב 11/1996 2 'ב 2/1997 1 'ג

7/1997 2 'ג 2/1998 1 'ד 5/1998 2 'ד 1/1999 1 'ה 5/1999 2 'ה 1/2000 1 'ו 6/2000 2 'ו 1/2001 1 'ז 6/2001 2 'ז 1/2002 1 'ח 6/2002 2 'ח 1/2003 1 'ט

SIGTRS - Vol. 19 Num 2 - 12/2012 61

Page 63: sigtrs vol 19 num 2

3

)2חוברת ' טיעד כרך ' כרך א(אינדקס לפי שם מאמר המשך

גליון כרך שם המחבר שם המאמר

.מס תאריך

6/2003 2 'ט 1/2004 1 'י 6/2004 2 'י 1/2005 1 'יא 6/2005 2 'אי 1/2006 1 'יב 6/2006 2 'יב 1/2007 1 'יג 6/2007 2 'יג 1/2008 1 'יד 6/2008 2 'יד 1/2009 1 'טו 6/2009 2 'טו 1/2010 1 'טז 6/2010 2 'טז 1/2011 1 'יז 7/2011 1 'יח 1/2011 2 ' יח 6/2012 1 'יט 12/2012 2 'יט 7/2011 1 'יח דן שמיר חשים ומכניסים הגיון לאינטרנט-וכמת האינטרנטח

12/2012 2 'יט ליזה בודוגין סיכום מפגש שולחן עגול, חיפוש ארגוני 1/2009 1 'טו אלעד רזניקוב חיפוש באמצעות קלסיפיקציה של מידע 1/2005 1 'יא גיורא שמעוני חיפוש חופשי בטקסטים סרוקים בעברית

הבעיה -טקסט מלא בעברית ובערבית חיפוש והפתרון

1/2004 1 'י ליאורה ירדני

1/2008 1 'יד אברהם מידן' דר חיפוש לפי משמעויות קובי אדלשטיין חיפוש מידע ברשת

וטל רפפורט 1/2002 1 'ח

1/2006 1 'יב אורי וינהבר חיפוש מידע מבוסס ניתוח טקסט, תגריםא. לראשונה בקוד פתוח: חיפוש עברי"

"והתמודדויות אחרות, פתרונות-איתמר סין

הרשקו 1/2011 1 יז

1/2002 1 'ח חנן כהן חיפוש תלוי הקשר 6/2003 2 'ט אלכס אברהם טיפול בנושא השמות ביד ושם

6/2002 2 'ח אביב ריפתין DTSearch - טכנולוגיות ה

7/1997 2 'ג טליה גליקשטיין Push - טכנולוגיית ה 6/2000 2 'ו מרק טויטו רנטיין ואינט

6/2004 2 'י איריס ארד ייצור אוטומטי של תיזאורי ומילונים דו לשוניים ר יהודית"ד יציבות מידע ברשת

אילן-בר 6/2000 2 'ו

4/1995 1 'א עפר דרורי ם"ישום מערכת איחזור מידע טקסטואלי בשע 12/2012 2 'יט גיורא שמעוני במאגר פסקי דין GSAישום

4/1995 1 'א גלעד וייזל TQLכיווני פיתוח באחזור טקסט

1/2007 1 'יג טלי שרון את המיטב Google - כיצד להוציא מכיצד לייצר ספר אלקטרוני עם תכונות חיפוש

Adobe Acrobatבאמצעות 1/2005 1 'יא עפר דרורי

6/2006 2 'ב מוטי חגיז כלי חיפוש סטנדרטיים במערכות ומוצרים קיימים 6/2001 2 'ז שפירא ברכה Antworld - כלי לחיפוש שיתופי באינטרנט 2/1996 1 'ג יעל אמיתי כלים לביצוע מחקר איטרטיבי

1/1999 1 'ה יוחאי שרון כלים לחיפוש מתקדם ברשת האינטרנט 7/2011 1 'יח עודד מימון' פרופ כריית מידע

5/1999 2 'ה יונתן רוזן לוח המפתחות העברי 5/1999 2 'ה יונתן רוזן למה כל כך קשה לכתוב בעברית

11/1996 2 'ב בני סגל מאגרי מידע משולבים טקסט ומידע חזותי 1/2011 1 'יז דורון מודן תרגום מכונה וזיהוי דיבור, מבוא לדיבור ממוחשב

6/2007 2 'יג עוזי אורנן' פרופ מבנה המילה והשתקפותו בניקוד ובתעתיק

SIGTRS - Vol. 19 Num 2 - 12/2012 62

Page 64: sigtrs vol 19 num 2

4

)2חוברת ' יטעד כרך ' כרך א(דקס לפי שם מאמר אינהמשך

גליון כרך שם המחבר שם המאמר

.מס תאריך

ההמצאה הכי שימושית שהומצאה אי - מגלה סרקזם פעם

7/2011 1 'יח אורן צור

6/2012 1 'יט מאיר פלבינסקי מגמות בזיהוי כתב יד 4/1995 1 'א יר אורי חננ"ד expetrextמגמות עתידיות בעולם איחזור המידע

1/2008 1 'יד גיורא שמעוני מורפולוגיה למנועי חיפוש 7/2011 1 'יח ירדן ירדני ?כיצד, מחקר בתיק דיגיטאלי בבתי המשפט

12/2012 2 'יט מאיר פלבינסקי מחשוב ארכיוניםמחשוב המתווה הלקסיקוגרפי של השפה העברית

בת זמננו-שירה זיסמן בן

דור 6/2005 2 'יא

סגמנטציה ומבנה קואורדינטות במערכת , מטריקה אחזור טקסט

1/2006 1 'יב איריס ארד

1/2009 1 'טו זאב גרינברג איך מחפשים ומוצאים - מיומנו של מחפש עצמאי מיפתוח אוטומטי מול מיפתוח ידני בסביבה

בחינה השוואתית: משרדית 1/2007 1 'יג תמי רוזנברג

1/2007 1 'יג עוזי אורנן ממנוע חיפוש לשלטי דרכיםממשק חלונאי אחד לטקסטים בסביבות עבודה

שונות ישראל מבשב

כוכבה טל 1/2001 1 'ז

ישראל מבשב ממשק שפה טבעית בעברית למסכי נתונים יחסיים כוכבה טל

1/2001 1 'ז

-מנוע אחזור באתר מוזיאון המדע בירושלים התלבטויות ושיקולים בבחירה

1/2005 1 'יא יוחאי שרון

1/2003 1 'ט ראובן אבגי גרסה חדשה - Inter Textמנוע האחזור

נחמה אנדלמן RetrievalWareמנוע החיפוש וצבי קמר

6/2003 2 'ט

12/2012 2 'יט אסף פרנקל SQLמנוע החיפוש של 6/2005 2 'יא עוזי אורנן מנוע חיפוש בטקסטים עבריים ידית אופירע מנוע חיפוש וניהול ידע בעברית

יורם זהבי 6/2002 2 'ח

מנוע חיפוש כתשתית לאוטומציה של תהליכים ידניים במאגרים טקסטואליים

1/1999 1 'ה מיקי קולקו

6/2003 2 'ט עפר דרורי מנוע חיפוש לשפה העברית 1/1999 1 'ה ערן פלמון מנוע חיפוש עברי במסדי נתונים מובנים

ר ברכה "ד כלכלי מנוע חיפוש שיתופי מבוסס מודל שפירא

6/2007 2 'יג

6/2005 2 'יא מיקי קולקו 2001מנוע לניתוח קשרים של חברת 6/2002 2 'ח עפר דרורי רשימת ספקים -מנועי חיפוש בעברית

רשימת ספקים - מנועי אחזור טקסט בעברית )3.2004גירסה (

6/2004 2 'י עפר דרורי

ספקים רשימת - מנועי אחזור טקסט בעברית )4.2005גירסה (

6/2005 2 'יא עפר דרורי

רשימת ספקים - מנועי אחזור טקסט בעברית )06.2006גירסה (

1/2007 1 'יג עפר דרורי

רשימת ספקים - מנועי אחזור טקסט בעברית )7.2009גרסה (

1/2010 1 'טז דרורי עפר

רשימת ספקים - מנועי אחזור טקסט בעברית )10.2010רסה יג(

1/2011 1 'יז ורי עפרדר

1/2009 1 'טו עינת שמעוני מנועי חיפוש ארגוניים 2/1997 1 'ג עפר דרורי מנועי חיפוש באינטרנט

6/2010 2 'טז מיקי קולקו מנוע לזיהוי ישויות 6/2003 2 'ט ר אורי חנני"ד MindCite -מנתונים לידע

מחשוב כתבי , מסמטאות קהיר לאינטרנט המהיר גניזת קהירהיד של

יעקב ' פרופ שויקה

6/2012 1 'יט

אביבה יפת מערכת לאיתור ישויות עפר דרורי

1/2004 1 'י

יזהר רגב מערכת מודולרית לכריית מידע מטקסט מאיה גורודצקי

רונן פלדמן

1/20006 1 'יב

SIGTRS - Vol. 19 Num 2 - 12/2012 63

Page 65: sigtrs vol 19 num 2

5

)2חוברת ' יטעד כרך ' כרך א(אינדקס לפי שם מאמר המשך

ליון ג כרך שם המחבר שם המאמר .מס

תאריך

5/1998 2 'ד איציק הוך נט- מערכת נוהלים בטכנולוגיית אינטרה -מפת הדרכים של החיפוש הארגוני במיקרוסופט

MOSS 1/2010 1 'טז רונה לוסטיג

-מפת הדרכים של החיפוש הארגוני במיקרוסופט Fast

1/2010 1 'טז תמיר קסל

1/2006 1 'יב וזי אורנןע מנוע חיפוש וניהול מימדים -ניאוזאורוס 5/1996 1 'ב עפר דרורי ניהול וארגון קבוצת ענין

טל רפפורט ניהול ידע דודו רשתי

1/2002 1 'ח

1/2012 2 'יח נמרוד בלומקין ניהול ידע בחקירות 1/2004 1 'י אלה שמחוני ניהול תוכן במשרד מבקר המדינה

1/2003 1 'ט עפר דרורי תכונות נדרשות - ניהול תוכן 1/2002 1 'ח אריק פישל ניצול אופטימלי של מנועי חיפוש 6/2007 2 'יג ר אינגריד ולן"ד ניתוח שאילתות באתרי מכירות

יובל ניתוח תחבירי חלקי קרימולובסקי

6/2007 2 'יג

סיווג אוטומטי של מסמכי טקסט בשפות שונות )כולל ערבית(

1/2007 1 'יג ר מרק לסט"ד

11/1996 2 'ב רות הנדזלר "ד יים במערכות אחזור טקסטסיכום מצב ק 11/1996 2 'ב ברכה שפירא סינון מידע בטכניקות מתקדמות

1/2009 1 'טו אורי עידן W3C - סמנטיק ווב וארגון ה 5/1999 2 'ה דודו רשתי עברית ברשת

נמרוד הרשברג עיבוד שפה טבעית בערבית כפיר בר

1/2008 1 'יד

כי חיפוש במאגרי מידע והצגתם עידון תהלי למשתמש

זיו סלייטר עזרא-רחל חי

6/2004 2 'י

תאריך גליון כרך שם המחבר שם המאמר 1/1999 1 /ה עפר דרורי עיצוב ממשק משתמש במערכות מידע

5/1998 2 'ד צביקה ווידנפלד WEB -עיצוב ממשק משתמש ל 5/1999 2 'ה יונתן רוזן ערכים מספריים לאותיות עבריות

פיתוח מערכת טקסטואלית תומכת החלטה בסביבה מרובת פלטפורמות

1/2001 1 'ז אריאלי אהוד

5/1998 2 'ד זוהר גילעד פתרונות לאבטחת איכות תוכנה גדי גולדרינג קיבוץ שאילתות במנועי חיפוש

ואיתן פאר 1/2004 1 'י

1/2001 1 'ז עפר דרורי קריטריונים להשוואה בין מנועי חיפוש 1/2003 1 'ט עפר דרורי 2גרסה -קריטריונים לבחירת מנוע אחזור טקסט 6/2004 2 'י עפר דרורי 3גרסה -קריטריונים לבחירת מנוע אחזור טקסט 1/2006 1 'יב עפר דרורי 4גרסה -קריטריונים לבחירת מנוע אחזור טקסט מאי - 5קריטריונים להשוואת מנוע חיפוש גרסה

2009 1/2010 1 'טז דרורי עפר

6/2003 2 'ט עפר דרורי )3.2003(רשימת ספקים למנועי אחזור בעברית 1/2003 1 'ט עפר דרורי )11.2002(רשימת ספקים של מנועי אחזור בעברית

לצורך ניהול Web 2.0רשמים משולחן עגול בנושא ידע ארגוני

1/2010 1 'טז עינת שמעוני

1/2004 1 'י וד יוקלסוןד שבעה צעדים לניהול ידע 1/2004 1 'י ברכה שפירא של תוכן) פרסונליזציה(שיטות להתאמה אישית

1/2002 1 'ח עפר דרורי Web -מידע ב -שילוב בסיסי נתונים ומאגרי

Web -שילוב בסיסי נתונים ומאגרי מידע באתר ה בספריה ובמרכזי מידע

6/2001 2 'ז עפר דרורי

1/2010 1 'טז עינת שמעוני בפרויקטי ניהול ידע Web 2.0שילוב מודלים של שילוב מערכות אחזור טקסט ומערכות מידע

קונבנציונליות 7/1997 2 'ג עפר דרורי

SIGTRS - Vol. 19 Num 2 - 12/2012 64

Page 66: sigtrs vol 19 num 2

6

)2חוברת ' יטעד כרך ' כרך א(אינדקס לפי שם מאמר המשך

גליון כרך שם המחבר שם המאמר

.מס תאריך

1/2007 1 'יג רינה ארד שימוש באונטולוגיות לניהול וארגון מידעפתוח ביישומי -שימוש בטכנולוגיות מבוססות קוד"

טקסט-אחזור ליאוניד גליבוב אורן יוסיפון

1/2011 1 'יז

תגיות לשיפור הופעת אתרים במנועי -שימוש במטה חיפוש

רפפורט טל דודו רשתי שולה גורן

1/2002 1 'ח

שימוש במילים נפוצות במסמך לאיתור נושא המסמך

1/2003 1 'ט עפר דרורי

באתר השאלות והתשובות IR - שימושים ב מהגדולים בעולים

6/2009 2 'טו יובל פיינשטיין

6/2005 2 'יא עפר דרורי שיקולים בבחירת מערכת לניהול תוכן 1/2009 1 'טו עפר דרורי שרות אחזור טקסט של גוגל

6/2009 2 'טו אמיר אליאסי שרות החיפוש של גוגל 10/1995 2 'א מיכל צור הרעיון ושימושיו במערכות אחזור טקסט, תזאורוס

1/2003 1 'ט אייל כהן D2K.NETתכונות מוצר לניהול הידע 1/2006 1 'יב עוזי אורנן ניאוזאורוס -תכונות מנוע האחזור

1/2003 1 'ט ליאורה ירדני תכונות מנוע החיפוש מורפיקס 1/2010 1 'טז עפר דרורי ATTIVIOתכונות מנוע החיפוש

1/2010 1 'טז עפר דרורי RexyGoתכונות מנוע החיפוש

1/2003 1 'ט אברהם מידן Wiz.Docתכונות מנוע החיפוש

1/2003 1 ' ט מיקי קולקו XRSתכונות מנוע החיפוש

6/2010 2 'טז עפר דרורי XRSתכונות מנוע החיפוש

6/2003 2 'ט יאלון מימונ Fastתכונות מנוע החיפוש

1/2010 1 'טז עפר דרורי Fastתכונות מנוע החיפוש

6/2003 2 'ט עפרה פרנקל Flairתכונות מנוע החיפוש

1/2003 1 'ט ראובן אבגי Inter Textתכונות מנוע החיפושחברי הכנסת כצרכני "תקציר מעבודת מחקר בנושא

מידערבקה ' דר

מרקוס 2012 2 'יח

Advisor - 6/2009 2 'טו חברת סלסנס ליצירת יישומי שפה טבעית כלי

A Modular Information Extraction System יזהר רגב מאיה גורודצקי

רונן פלדמן

1/2006 1 'יב

Contex - 1/2006 1 'יב יניב שושני מוצר לניהול תוכן

Full Text - 1/2001 1 'ז שחר אורון מנוע חיפוש בעברית

GUIdance :י ליצירת ממשק גרפי למערכת כלMF 10/1995 2 'א דרור אורנשטיין

Information Retrieval Rijsbergen C.J. Van

6/2003 2 'ט

Informayion Retrieval Interaction Peter Ingwersen

6/2003 2 'ט

Inter Text 2/1998 1 'ד איציק הוך

MKnowledge - ניתוח והצגה של , תוכנה לקבלה דעי

1/2011 1 יז ניר לוי

NanoSyntax - גישה חדשנית להבנת שפה טבעית ביישומי מחשב

6/2007 2 'יג ששון מרגליות

RexyGo 1/2010 1 'טז יוסי דבש מנוע חיפוש חדש

TDNet searcher analyzer 1/2006 1 'יב משה עפרון TRS - המרכיבים השונים של -מאחורי הקלעים

כת והיישומים האפשרים בההמער 10/1995 2 'א פטר רוזן

3.0 Web טכנולוגיות סמנטיות באינטרנט -מעבר לפינה ובארגונים

6/2010 2 'טז רוני חזקיה

SIGTRS - Vol. 19 Num 2 - 12/2012 65

Page 67: sigtrs vol 19 num 2

7

)2חוברת ' יטעד כרך ' כרך א(אינדקס לפי שם מאמר המשך

גליון כרך שם המחבר שם המאמר .מס

תאריך

WizDoc - 6/2003 2 'ט אברהם מידן יות בעברית ובאנגלית מנוע חיפוש לפי משמעו XML - 6/2001 2 'ז שרוטר גרטהמסלול המהיר לכלכלה החדשה

XML 6/2000 2 'ו אבגי ראובן והשלכותיו על בסיסי נתונים ואחזור טקסט

Yad Vashem names and places index Alex Avraha 6/2003 2 'ט

SIGTRS - Vol. 19 Num 2 - 12/2012 66