เครื่องมือค้นหาที่เก่าแก่ที่สุดคืออะไร เครื่องมือค้นหาของรัสเซีย ผู้ที่อยู่ในเงามืด

ในช่วงเวลาที่การพัฒนาอินเทอร์เน็ตเพิ่งเริ่มต้น ปริมาณข้อมูลที่มีอยู่ค่อนข้างน้อย และมีผู้ใช้อินเทอร์เน็ตเพียงไม่กี่คน ในช่วงเริ่มต้นของการพัฒนาเครือข่าย พนักงานของมหาวิทยาลัยและห้องปฏิบัติการวิจัยใช้เพื่อแลกเปลี่ยนข้อมูลระหว่างสถาบันต่างๆ สมัยนั้นการค้นหาข้อมูลทางอินเตอร์เน็ตไม่มีความเกี่ยวข้องเหมือนทุกวันนี้

วิธีแรกในการจัดระเบียบและจัดระบบการเข้าถึงทรัพยากรข้อมูลคือการสร้างไดเรกทอรีของเว็บไซต์ พวกเขาเริ่มจัดกลุ่มลิงก์ตามหัวข้อเฉพาะ

พื้นที่นี้บุกเบิกโดย Yahoo ซึ่งปรากฏในเดือนเมษายน พ.ศ. 2537 เมื่อเวลาผ่านไป จำนวนไซต์เพิ่มขึ้น และ Yahoo ได้เพิ่มตัวเลือกการค้นหาไดเรกทอรี มันไม่ใช่เครื่องมือค้นหาในความหมายที่แท้จริงที่สุด เนื่องจากขอบเขตการค้นหาถูกจำกัดอยู่เพียงทรัพยากรไดเรกทอรี

ต่อจากนั้นแคตตาล็อกก็แพร่กระจายและเริ่มนำไปใช้ทุกที่ แต่อินเทอร์เน็ตไม่ได้หยุดนิ่ง แต่ยังคงพัฒนาต่อไป นอกจากนั้นยังมีการพัฒนาวิธีการค้นหาด้วย ในขณะนี้ ไดเร็กทอรีเกือบจะสูญเสียความนิยมไป ซึ่งอธิบายได้จากข้อเท็จจริงที่ว่าไดเร็กทอรีสมัยใหม่แม้ว่าจะมีทรัพยากรจำนวนมาก แต่ก็สามารถให้การเข้าถึงข้อมูลส่วนเล็ก ๆ ที่มีอยู่ในเครือข่ายเท่านั้น

ปัจจุบัน ไดเรกทอรีที่ใหญ่ที่สุดบนเว็บคือ Open Directory Project หรือ DMOZ ซึ่งมีข้อมูลเกี่ยวกับทรัพยากร 5 ล้านรายการ แต่ถือว่าค่อนข้างน้อยเมื่อเทียบกับ ตัวอย่างเช่น เครื่องมือค้นหาของ Google ซึ่งมีเอกสารประมาณ 8 พันล้านฉบับ

ระบบค้นหาเต็มรูปแบบเปิดตัวในปี 1994 เท่านั้นและกลายเป็นระบบค้นหา WebCrawler

อีกหนึ่งปีต่อมาในปี 1995 โปรเจ็กต์เครื่องมือค้นหา AltaVista และ Lycos ก็ปรากฏขึ้น โดยเฉพาะอย่างยิ่งหนึ่งในนั้นคือ AltaVista ซึ่งครองตำแหน่งผู้นำในด้านการค้นหามาหลายปี

สองปีต่อมา ในปี 1997 นักศึกษามหาวิทยาลัยสแตนฟอร์ด เซอร์เกย์ บริน และแลร์รี เพจ ได้พัฒนาเครื่องมือค้นหาของ Google ซึ่งเป็นผู้นำในการค้นหาในปัจจุบัน

ปีนี้เป็นปีที่มีการประกาศการสร้างเครื่องมือค้นหา Yandex ของรัสเซียอย่างเป็นทางการซึ่งยังคงเป็นผู้นำในกลุ่มเครือข่ายภาษารัสเซีย

ขณะนี้มีเสิร์ชเอนจิ้นเพียง 3 ตัวที่เข้าถึงระดับสากล ได้แก่ MSN Search, Yahoo และ Google ระบบเหล่านี้มีฐานข้อมูลและอัลกอริธึมการค้นหาของตัวเอง เครื่องมือค้นหาอื่น ๆ ส่วนใหญ่ใช้ผลลัพธ์ของพวกเขา ดังนั้น Mail.ru จึงใช้ฐานข้อมูล Yandex, search.aol.com ใช้ Google และ Lycos, AltaVista และ AllTheWeb ใช้ Yahoo

ผู้นำการค้นหาบนอินเทอร์เน็ตรัสเซียในขณะนี้คือ Yandex ตามด้วย Rambler ตามด้วย Google, Mail.ru, A port และ KM.ru

เครื่องมือค้นหามีอัลกอริธึมการทำงานที่แตกต่างกัน และเพื่อที่จะได้ตำแหน่งที่ดีในผลการค้นหาและดึงดูดผู้เข้าชมเป้าหมาย คุณจำเป็นต้องทราบคุณสมบัติของการเพิ่มประสิทธิภาพ SEO สำหรับเครื่องมือค้นหาต่างๆ ตัวอย่างเช่น

ในช่วงปีแรก ๆ ของการพัฒนาชุมชนอินเทอร์เน็ต ผู้ใช้อินเทอร์เน็ตที่ใช้งานอยู่ถือเป็นส่วนน้อย และปริมาณข้อมูลในทรัพยากรอินเทอร์เน็ตค่อนข้างน้อย โดยส่วนใหญ่แล้ว มีเพียงพนักงานของห้องปฏิบัติการวิทยาศาสตร์และสถาบันการศึกษาขนาดใหญ่เท่านั้นที่สามารถเข้าถึงเครือข่ายข้อมูลทั่วโลก โดยทั่วไป การใช้ทรัพยากรเครือข่ายไม่เกี่ยวข้องเท่าในปัจจุบัน

ประวัติความเป็นมาของการพัฒนาเครื่องมือค้นหา

ก้าวสำคัญในการแพร่กระจายอินเทอร์เน็ตสู่คนจำนวนมากคือการปรากฏตัวในปี 1990 ของเว็บไซต์ info.centr.ch ไซต์นี้เป็นไดเรกทอรีแรกของเว็บไซต์อินเทอร์เน็ตที่สาธารณชนสามารถเข้าถึงได้ ผู้สร้างคือนักวิทยาศาสตร์ชาวอังกฤษ Tim Berners-Lee ซึ่งถือเป็นผู้สร้าง URI, HTTP, World Wide Web และ URL ตั้งแต่นั้นเป็นต้นมาเว็บไซต์อินเทอร์เน็ตมีความเกี่ยวข้องไม่เพียง แต่ในแวดวงผู้ใช้เฉพาะทางเท่านั้น แต่ยังรวมถึงเจ้าของคอมพิวเตอร์ที่บ้านทั่วไปด้วย ในแค็ตตาล็อกนี้ เพื่อความสะดวก ทรัพยากรข้อมูลถูกจัดเรียงตามกลุ่มในหัวข้อที่คล้ายกัน ซึ่งอำนวยความสะดวกในการค้นหาข้อมูลอย่างมาก

แต่ความก้าวหน้าไม่ได้หยุดอยู่แค่นั้น และในปี 1994 เทคโนโลยีการค้นหาที่พัฒนาโดยมหาวิทยาลัย Carnegie หรือที่รู้จักในชื่อ Lucos ก็ถือกำเนิดขึ้น ไดเร็กทอรีนี้ ซึ่งสร้างโดย Michael Maldin เริ่มต้นจากทรัพยากรที่มีเอกสารมากกว่า 50,000 ฉบับ ใน Lucos ข้อความค้นหาจะพิจารณาการจับคู่โดยประมาณของข้อความค้นหา และผลการค้นหาจะได้รับการจัดอันดับขึ้นอยู่กับการจับคู่ระหว่างข้อมูลอินพุตและเอาต์พุต นอกจากนี้ทรัพยากรยังได้รับการอัปเดตอย่างต่อเนื่องด้วยหน้าอินเทอร์เน็ตใหม่ ในเดือนพฤศจิกายน Lucos มีเอกสารและเอกสารมากกว่า 55 ล้านหน้า ซึ่งมากกว่าแคตตาล็อกเอกสารใดๆ ในขณะนั้นมาก

ในตอนท้ายของปี 1994 ทรัพยากรของ Infosek ปรากฏขึ้น มีข้อดีหลายประการเมื่อเทียบกับทรัพยากรอื่นๆ ตัวอย่างเช่น การเพิ่มไซต์โดยผู้ใช้ไปยังฐานข้อมูลไดเร็กทอรีแบบเรียลไทม์

สัตว์ประหลาดตัวใหม่ในอุตสาหกรรมเครื่องมือค้นหาในปี 1995 คือ AltaVista เธอได้รับความนิยมอย่างรวดเร็วในหมู่ผู้ใช้อินเทอร์เน็ตและเป็นผู้นำในสาขาของเธอ คุณลักษณะหลักของมันคือความสามารถในการกำหนดคำสั่งในภาษาที่เป็นธรรมชาติและเป็นภาษาพูด และผู้ใช้ยังได้รับอนุญาตให้เพิ่มที่อยู่ URL ของตนเองได้ แต่ข้อดีหลักของ AltaVista คือการรองรับชุดภาษาหลายภาษา เช่น เกาหลี ญี่ปุ่น จีน และรัสเซีย

ขั้นตอนสำคัญในเทคโนโลยีการค้นหาคือการปรากฏตัวบนอินเทอร์เน็ตของเสิร์ชเอ็นจิ้นใหม่ซึ่งปัจจุบันเป็นที่รู้จักกันดีสำหรับผู้ใช้ทุกคน ได้แก่ Google ในปี 1997 L. Page และ S. Brin จากมหาวิทยาลัยสแตนฟอร์ดได้แนะนำคุณลักษณะใหม่ๆ ในอัลกอริธึมการค้นหาของลูกหลาน ในการค้นหา มีการใช้ระบบความเกี่ยวข้องของผลการค้นหาที่ออกโดยระบบ และคำนึงถึงสัณฐานวิทยาและข้อผิดพลาดในการสะกดคำที่อาจเกิดขึ้นเมื่อทำการสืบค้น

ปัจจุบันมีผู้นำหลักสามรายในตลาดเครื่องมือค้นหา: Bing, Google และ Yahoo พวกเขามีอัลกอริธึมการค้นหาและฐานข้อมูลการผลิตของตนเอง เสิร์ชเอ็นจิ้นจำนวนมากซึ่งมีอยู่มากมายใช้การพัฒนาของไททันทั้งสามนี้ในเสิร์ชเอ็นจิ้น

ต้องขอบคุณเสิร์ชเอ็นจิ้นที่ทำให้คนธรรมดาสามารถค้นพบพื้นที่ข้อมูลอันกว้างใหญ่ได้ง่ายขึ้น หากไม่มีการพัฒนา ก็เป็นไปไม่ได้ที่จะปรับปรุงวิธีการแลกเปลี่ยนข้อมูลระหว่างผู้คน

เครื่องมือค้นหาใดเป็นเครื่องมือค้นหาแรกใน RuNet Yandex, Aport หรือ Rambler?

เครื่องมือค้นหา Runet แรกสุด (ซึ่งตามหนึ่งในผู้ก่อตั้ง Rambler มี 2 หรือ 3 แห่ง) จมลงสู่การลืมเลือนอย่างรวดเร็ว หนึ่งในนั้นคือส่วนขยายทางสัณฐานวิทยาของระบบ AltaVista ซึ่งไม่ได้ทิ้งชื่อไว้ให้เรา ดังนั้นเราจะต้องเลือกจากผู้ที่ยังคงอยู่:

เดินเตร่

การสร้าง Rambler เริ่มขึ้นในปี 1996 เมื่อมีไซต์เพียงไม่กี่สิบแห่งในกลุ่มอินเทอร์เน็ตของรัสเซีย การพัฒนาแล้วเสร็จในฤดูใบไม้ร่วงปีนั้น โดเมน rambler.ru ได้รับการจดทะเบียนเมื่อวันที่ 26 กันยายน และ 8 ตุลาคม 1996ในวันเกิดของหนึ่งในผู้สร้าง Rambler เปิดให้ผู้ใช้

Rambler - เครื่องมือค้นหาแรกใน Runetของที่มีอยู่ในปัจจุบัน

เครื่องมือค้นหา Aport ได้รับการพัฒนาภายในเดือนกุมภาพันธ์ พ.ศ. 2539 แต่ในขณะนั้นค้นหาเฉพาะบนเว็บไซต์ russia.agama.com เท่านั้น จำนวนไซต์เพิ่มขึ้นทีละน้อยและเข้าสู่การเปิดอย่างเป็นทางการ 11 พฤศจิกายน 1997ปี “Aport” ถูกค้นหาแล้ว 10,000 เว็บไซต์ ดังนั้น "Aport" จึงเป็นหนึ่งในเครื่องมือค้นหาแรกๆ ใน Runet แต่เนื่องจากขอบเขตการค้นหาที่จำกัด จึงไม่สามารถจำแนกได้ว่าเก่าที่สุด

ยานเดกซ์

CompTek บริษัทที่พัฒนา Yandex ก่อตั้งขึ้นในปี 1989 ในปี 1993 CompTek ได้พัฒนา Yandex ซึ่งเป็นโปรแกรมค้นหาฮาร์ดไดรฟ์ ในปี 1996 โปรแกรมได้เพิ่มความสามารถในการค้นหาเว็บ ในปี 1997 มีการเขียนหุ่นยนต์ค้นหาตัวแรก Runet ได้รับการจัดทำดัชนีและ 23 กันยายน 1997มีการนำเสนออย่างเป็นทางการของ Yandex

Yandex ของ CompTek ไม่ใช่บริษัทที่เก่าแก่ที่สุด แต่เทคโนโลยีการค้นหาและการวิจัยด้านภาษาศาสตร์และสัณฐานวิทยาของพวกเขานั้นเก่าแก่ที่สุดในรัสเซีย








ความนิยมของเครื่องมือค้นหาในรัสเซีย ยูเครน และทั่วโลก ประวัติความเป็นมาของการพัฒนาเครื่องมือค้นหา Rambler และ Aport เป็นไดโนเสาร์ที่สูญพันธุ์
ฉันรักษาไว้เสมอและจะรักษาต่อไปว่าผู้เชี่ยวชาญแคบ ๆ ที่ไม่สนใจสิ่งอื่นใดนอกจากรายละเอียดเชิงปฏิบัติล้วนๆ จะไม่สามารถบรรลุความสูงที่แท้จริงในอาชีพของเขาได้ บุคคลดังกล่าวจะไม่ "แคบ" แต่ "ใจแคบ" :-) ดังนั้นเรามาดูประวัติความเป็นมาของการพัฒนาเสิร์ชเอ็นจิ้นรวมถึงส่วนแบ่งการตลาดที่แต่ละเสิร์ชเอ็นจิ้นครอบครองอยู่ในปัจจุบัน ความนิยมของเครื่องมือค้นหาในรัสเซียและยูเครนเป็นช่วงเวลาที่สำคัญมากในการโปรโมต

ประวัติความเป็นมาของการพัฒนาเครื่องมือค้นหา . ย้อนกลับไปในทศวรรษที่ 90 เมื่ออินเทอร์เน็ตเพิ่งเริ่มมีการใช้งาน ไม่มีเครื่องมือค้นหาในความหมายสมัยใหม่ การค้นหาทรัพยากรที่ต้องการเกิดขึ้นผ่านไดเร็กทอรีของเว็บไซต์ โดยที่โครงการอินเทอร์เน็ตที่มีอยู่ในขณะนั้นจัดเรียงตามหัวข้อต่างๆ เนื่องจากมีผู้ใช้น้อยบนเครือข่าย และมีเว็บไซต์เพียงไม่กี่แห่ง วิธีการจัดโครงสร้างข้อมูลนี้จึงค่อนข้างสะดวกและเพียงพอ

เครื่องมือค้นหาเต็มรูปแบบตัวแรกคือโครงการ WebCrawler ความแตกต่างพื้นฐานจากรุ่นก่อนคือเครื่องมือค้นหานี้ดำเนินการสิ่งที่เรียกว่า ค้นหาข้อความแบบเต็ม เหล่านั้น. ค้นหาไม่เพียงแต่ในเครื่องในบางไดเร็กทอรีเท่านั้น ไม่เพียงแต่โดยเมตาแท็กคำหลักเท่านั้น แต่ยังวิเคราะห์ข้อความทั้งหมดของหน้าเว็บ ซึ่งทำให้สามารถค้นหาวลีใดๆ ได้สำเร็จ (และไม่ใช่เพียงวลีที่ผู้ดูแลเว็บระบุไว้ในคำอธิบายของเว็บไซต์ของเขา เป็นคนสำคัญ)

โดยส่วนตัวแล้วชื่อ WebCrawler ไม่ได้มีความหมายอะไรสำหรับฉัน - มันไกลเกินไปในอดีตในรัสเซียในเวลานั้นไม่ใช่ทุกคนที่เคยได้ยินคำว่าอินเทอร์เน็ต :-) แต่ Lycos ซึ่งปรากฏในปี 1996 เป็นที่รู้จักกันดีในหมู่ผู้สูงอายุแล้ว ผู้ดูแลเว็บ อย่างน้อยนั่นก็เป็นชื่อที่หลายๆ คนคุ้นเคย ไม่นานหลังจาก Lykos ซึ่งเป็นเครื่องมือค้นหาที่ดีที่สุดในยุคนั้น AltaVista เปิดตัว คุณอาจเคยได้ยินชื่อนี้ จนถึงประมาณปี 2000 AltaVista ยังคงเป็นเครื่องมือค้นหาชั้นนำของโลก

Google ก่อตั้งขึ้นในปี 1998 นักพัฒนา Sergey Brin และ Larry Page ปฏิวัติคุณภาพของการค้นหาโดยการพัฒนาอัลกอริธึม PageRank ซึ่งช่วยให้คำนึงถึง "น้ำหนัก" ของหน้าเว็บ ขึ้นอยู่กับจำนวนลิงก์ที่เชื่อมโยงไปยังหน้านั้น สิ่งนี้ช่วยปรับปรุงคุณภาพการค้นหาอย่างมากจน Google เริ่มดึงดูดผู้ชมได้อย่างรวดเร็วและภายในไม่กี่ปีก็กลายเป็นเครื่องมือค้นหาชั้นนำของโลกซึ่งยังคงอยู่มาจนถึงทุกวันนี้ ฉันจำได้ว่าประมาณปี 2000 ที่สถาบัน ฉันได้ดูการโต้เถียงระหว่างนักเรียนสองคนในกลุ่มของเราว่า Altavista แย่แค่ไหน แต่ Google ค้นหาได้ดีกว่า :-)

เครื่องมือค้นหา Aport . การพัฒนาของบริษัท Agama เปิดตัวในปี 1996 โครงการที่ยังคงเป็นเครื่องมือค้นหาชั้นนำบน Runet เป็นเวลาหลายปี ขณะที่ผมเขียนเรื่องนี้ ผมเริ่มรู้สึกโบราณมาก :-) ท้ายที่สุดแล้ว กาลครั้งหนึ่งในฐานะนักเรียน มันคือ Aport ที่เราเคยค้นหากัน ไม่มีทางเลือกอื่น และไม่จำเป็น เพราะ Aport ทำหน้าที่ได้อย่างสมบูรณ์แบบ


อย่างไรก็ตาม การเริ่มต้นที่ดีเยี่ยมไม่ได้รับประกันการพัฒนาที่ยอดเยี่ยมเท่าเทียมกันในอนาคต Aport เป็นอาหารจานเดียวที่อร่อยจนต้องเปลี่ยนเจ้าของหลายครั้ง และแต่ละครั้งก็ขายได้ราคามากขึ้นเรื่อยๆ เห็นได้ชัดว่านี่คือสิ่งที่ทำลายเขา “การจัดการและการตลาดที่มีประสิทธิผล” มาก่อน ในขณะที่การสนับสนุนทางเทคนิคก็ถูกละเลยไป หลังจากนั้นผู้ใช้ Runet หันหลังให้กับ Aport โชคดีที่เครื่องมือค้นหาหลักอีกสองตัวคือ Rambler และ Yandex กำลังต่อสู้อย่างแข็งขันเพื่อสถานที่ที่อยู่กลางแสงแดด

ฉันจำวันที่แน่นอนไม่ได้ แต่ก่อนอื่น Aport ละทิ้งอัลกอริธึมการจัดอันดับของตัวเองเริ่มใช้ข้อมูล Yandex และเมื่อสองสามปีที่แล้วมันก็หยุดอยู่ในฐานะเครื่องมือค้นหาโดยสิ้นเชิง ขณะนี้บนโดเมนที่มีชื่อเสียงมีร้านค้าออนไลน์และไม่ใช่คุณภาพที่ดีที่สุด

เอ๊ะ... แต่กาลครั้งหนึ่ง Aport ก็มีแคตตาล็อกของตัวเองซึ่งผู้ดูแลเว็บพยายามเข้าถึงด้วยพลังที่เกือบจะเหมือนกับที่พวกเขาทำใน Yandex ในตอนนี้ อย่างไรก็ตาม การออกแบบครั้งแรกสำหรับ Aport ได้รับการพัฒนาโดย Artemy Lebedev... เกือบจะพร้อมกันกับการออกแบบสำหรับ Yandex

เครื่องมือค้นหา Rambler . Rambler เปิดตัวในปี 1996 และยังคงเป็นหนึ่งในผู้เล่นหลักในตลาดมาเกือบทศวรรษ ต่างจาก Aport ที่ "ล้มลง" อย่างรวดเร็วมาก Rambler เลื่อนไปสู่ ​​"สถานการณ์คนไร้บ้าน" ในปัจจุบันอย่างช้าๆ และด้วยการต่อต้าน


จนกระทั่งวินาทีสุดท้าย Rambler ยังคงใช้งานเสิร์ชเอ็นจิ้นซึ่งทำให้เกิดคุณภาพดี ลองคิดดูสิ - เป็นเวลาหลายปี Rambler เป็นเครื่องมือค้นหาที่สองของ Runet และอันที่สามไม่ใช่ Aport ที่ตายไปแล้วครึ่งหนึ่ง แต่เป็น Google ที่ทรงพลัง!

อย่างไรก็ตาม ส่วนแบ่งการตลาดของ Rambler ลดลงและลดลง และในปี 2011 Yandex ได้ซื้อ Rambler และเริ่มให้ผลลัพธ์เหมือนกับของ Yandex เรื่องราวของ Rambler ซึ่งครั้งหนึ่งเคยเป็นเสิร์ชเอ็นจิ้นที่แข็งแกร่งที่สุดของรัสเซียจึงจบลง

เครื่องมือค้นหา Google และ Yandex . ในขณะนี้เหลือเครื่องมือค้นหาที่เกี่ยวข้องเพียงสองรายการเท่านั้น - Yandex และ Google Lukos และ Altavist ทุกประเภทถูกลืมไปนานแล้วและไม่ได้ทำหน้าที่เป็นบริการค้นหา Yandex ซื้อ Rambler และตอนนี้แสดงผลลัพธ์ของรุ่นหลัง Aport ได้กลายเป็นร้านค้าออนไลน์ Yahoo และ Bing ครองส่วนแบ่งตลาดเพียงเล็กน้อย - ค้นหาจาก Microsoft ในรัสเซียนอกเหนือจาก Yandex และ Google แล้วยังมี Mail.ru ด้วย แต่ไม่มีเครื่องมือค้นหาของตัวเอง แต่ใช้ผลการค้นหาจาก Google ทำการปรับเปลี่ยนเพียงเล็กน้อยเท่านั้น

ความนิยมของเครื่องมือค้นหาในรัสเซีย ยูเครน และทั่วโลก . ในขณะนี้ตลาดการค้นหาในรัสเซียแบ่งออกเป็นประมาณดังนี้:

ยานเดกซ์ – 63%
กูเกิล – 26%
Mail.ru – 8%
เดินเตร่ – 1.5%
ปิง – 0.6%

ในยูเครนอัตราส่วนแตกต่างกันอย่างมีนัยสำคัญ Yandex ล้าหลังคู่แข่งหลัก แต่กำลังเพิ่มส่วนแบ่งการตลาดอย่างช้าๆ:

กูเกิล – 60%
ยานเดกซ์ – 29%
Mail.ru – 6%

ในการค้นหาทั่วโลก มีผู้นำเพียงคนเดียวเท่านั้นที่เด็ดขาดและไม่มีเงื่อนไข - Google

อย่างไรก็ตาม คุณและฉันรู้สึกภาคภูมิใจที่สมควรได้รับในประเทศของเรา - มีเพียงรัสเซียและจีนเท่านั้นที่สร้างระบบการค้นหาของตนเอง ไม่มีเครื่องมือค้นหาคุณภาพสูงปรากฏที่ใดในโลกอีกแล้ว ในประเทศแถบยุโรป - ฝรั่งเศส เยอรมนี และอื่นๆ - มีผู้ใช้ Google มากถึง 97-99% เช่น โดยพื้นฐานแล้วไม่มีทางเลือกอื่น

นอกจากนี้ยังมีแง่มุมที่เป็นประโยชน์ในเรื่องนี้ด้วย - เว็บมาสเตอร์ชาวรัสเซียมีโอกาสที่ดีกว่าในการรับผู้เยี่ยมชมจากการค้นหา มันมักจะเกิดขึ้นที่ยานเดกซ์ "ชอบ" ไซต์ แต่ Google ไม่ทำหรือในทางกลับกัน แต่ในทั้งสองกรณี เว็บไซต์ก็มีลูกค้าอยู่แล้ว เพื่อนร่วมงานชาวตะวันตกของเราใช้หลักการ "ทั้งหมดหรือไม่มีเลย"

มีประเด็นที่สอง - การโปรโมตใน Google และ Yandex นั้นแตกต่างกันในระดับหนึ่งและความปรารถนาที่จะขึ้นสู่ตำแหน่งสูงสุดของผู้นำทั้งสองก็ทิ้งร่องรอยไว้ในรูปแบบการโปรโมตไซต์

หนังสือของฉันได้รับการตีพิมพ์ในรูปแบบกระดาษหากบทช่วยสอนนี้มีประโยชน์สำหรับคุณ คุณสามารถขอบคุณฉันไม่เพียงแต่ในทางศีลธรรมเท่านั้น แต่ยังในรูปแบบที่จับต้องได้อีกด้วย
ในการทำเช่นนี้คุณต้องไปที่

โดยทั่วไปสถาปัตยกรรมเครื่องมือค้นหาจะประกอบด้วย:

YouTube สารานุกรม

    1 / 5

    √ บทที่ 3: วิธีการทำงานของเสิร์ชเอ็นจิ้น รู้เบื้องต้นเกี่ยวกับ SEO

    √ เครื่องมือค้นหาจากภายใน

    ús Shodan - Google สีดำ

    ➤ เครื่องมือค้นหา CHEBURASHKA จะเข้ามาแทนที่ Google และ Yandex ในรัสเซีย

    √ บทที่ 1 - วิธีการทำงานของเสิร์ชเอ็นจิ้น

    คำบรรยาย

เรื่องราว

ลำดับเหตุการณ์
ปี ระบบ เหตุการณ์
1993 W3แค็ตตาล็อก?! ปล่อย
อาลีเว็บ ปล่อย
จั๊มสเตชั่น ปล่อย
1994 โปรแกรมรวบรวมข้อมูลเว็บ ปล่อย
อินโฟซีค ปล่อย
ไลคอส ปล่อย
1995 อัลตาวิสต้า ปล่อย
ดาอุม ฐาน
เปิดข้อความดัชนีเว็บ ปล่อย
มาเจลลัน ปล่อย
ตื่นเต้น ปล่อย
สาโป ปล่อย
ยาฮู! ปล่อย
1996 หมา ปล่อย
อิงค์โทมิ ฐาน
เดินเตร่ ฐาน
ฮอทบอท ฐาน
ถาม จีฟส์ ฐาน
1997 ทางตอนเหนือของแสง ปล่อย
ยานเดกซ์ ปล่อย
1998 Google ปล่อย
1999 ออลเดอะเว็บ ปล่อย
GenieKnows ฐาน
เนเวอร์ ปล่อย
เตโอมะ ฐาน
วิวิซิโม่ ฐาน
2000 ไป่ตู้ ฐาน
เอ็กเซล ฐาน
2003 ข้อมูล.com ปล่อย
2004 ยาฮู! ค้นหา เปิดตัวครั้งสุดท้าย
A9.com ปล่อย
โซโก ปล่อย
2005 MSN ค้นหา เปิดตัวครั้งสุดท้าย
ถาม.คอม ปล่อย
นิกมา ปล่อย
ค้นหาที่ดี ปล่อย
ค้นหาฉัน ฐาน
2006 วิกิซีก ฐาน
ควาเอโร ฐาน
สด ค้นหา ปล่อย
ชาช่า เปิดตัว (เบต้า)
กูรูจิดอทคอม เปิดตัว (เบต้า)
2007 วิกิซีก ปล่อย
สโปรส ปล่อย
Wikia ค้นหา ปล่อย
แบล็กเคิลดอทคอม ปล่อย
2008 เป็ดเป็ดGo ปล่อย
ทูบี้ ปล่อย
พิคอลเลเตอร์ ปล่อย
วิวซี่ ปล่อย
คิวอิล ปล่อย
บูกามิ ปล่อย
กระโดดปลา เปิดตัว (เบต้า)
ฟอเรสท์ ปล่อย
วาดโล ปล่อย
พาวเวอร์เซ็ต ปล่อย
2009 ปิง ปล่อย
คาซ.เคแซด ปล่อย
เยโบล เปิดตัว (เบต้า)
มูเกอร์ดี ปิด
ลูกเสือ ปล่อย
2010 คิวอิล ปิด
เบล็กโก้ เปิดตัว (เบต้า)
วิวซี่ ปิด
2012 วาซซูบ ปล่อย
2014 ดาวเทียม เปิดตัว (เบต้า)

ในช่วงต้นของการพัฒนาอินเทอร์เน็ต Tim Berners-Lee ดูแลรักษารายชื่อเว็บเซิร์ฟเวอร์ที่โฮสต์บนเว็บไซต์ CERN มีไซต์เพิ่มมากขึ้นเรื่อยๆ และการดูแลรายการดังกล่าวด้วยตนเองก็ยิ่งยากขึ้นเรื่อยๆ เว็บไซต์ NCSA มีส่วนพิเศษ “มีอะไรใหม่!” (อังกฤษ: มีอะไรใหม่!) ซึ่งพวกเขาเผยแพร่ลิงก์ไปยังไซต์ใหม่

โปรแกรมคอมพิวเตอร์เครื่องแรกสำหรับการค้นหาอินเทอร์เน็ตคือโปรแกรม อาร์ชี่(อาร์ชีอังกฤษ - เก็บถาวรโดยไม่มีตัวอักษร "c") ถูกสร้างขึ้นในปี 1990 โดย Alan Emtage, Bill Heelan และ J. Peter Deutsch นักศึกษาวิทยาศาสตร์คอมพิวเตอร์ที่ McGill University ในมอนทรีออล โปรแกรมดาวน์โหลดรายการไฟล์ทั้งหมดจากเซิร์ฟเวอร์ FTP ที่ไม่เปิดเผยตัวตนที่มีอยู่ทั้งหมด และสร้างฐานข้อมูลที่สามารถค้นหาด้วยชื่อไฟล์ได้ อย่างไรก็ตาม โปรแกรมของ Archie ไม่ได้จัดทำดัชนีเนื้อหาของไฟล์เหล่านี้ เนื่องจากปริมาณข้อมูลมีขนาดเล็กมากจนสามารถค้นหาทุกสิ่งได้อย่างง่ายดายด้วยตนเอง

การพัฒนาและการแพร่กระจายของโปรโตคอลเครือข่าย Gopher ซึ่งคิดค้นในปี 1991 โดย Mark McCahill จากมหาวิทยาลัย Minnesota นำไปสู่การสร้างโปรแกรมค้นหาใหม่สองโปรแกรม เวโรนิกาและจั๊กเฮด เช่นเดียวกับ Archie พวกเขาค้นหาชื่อไฟล์และส่วนหัวที่จัดเก็บไว้ในระบบดัชนี Gopher เวโรนิกา (อังกฤษ) ดัชนี Net-wide ที่เน้นสัตว์ฟันแทะที่ง่ายมากไปยังเอกสารสำคัญทางคอมพิวเตอร์) อนุญาตให้มีการค้นหาคำหลักสำหรับชื่อเมนู Gopher ส่วนใหญ่ในรายการ Gopher ทั้งหมด โปรแกรมจั๊กเฮด การขุดค้นและแสดงลำดับชั้นโกเฟอร์สากลของ Jonzy) ดึงข้อมูลเมนูจากเซิร์ฟเวอร์ Gopher เฉพาะ แม้ว่าชื่อของเครื่องมือค้นหาของ Archie จะไม่เกี่ยวข้องกับซีรีส์หนังสือการ์ตูนก็ตาม “อาร์ชี่”อย่างไรก็ตาม Veronica และ Jughead เป็นตัวละครในการ์ตูนเหล่านี้

ในฤดูร้อนปี 1993 ยังไม่มีระบบเดียวสำหรับการค้นหาอินเทอร์เน็ต แม้ว่าไดเร็กทอรีพิเศษจำนวนมากจะได้รับการดูแลด้วยตนเองก็ตาม Oscar Nierstrasz จากมหาวิทยาลัยเจนีวาได้เขียนชุดสคริปต์ Perl ซึ่งจะคัดลอกหน้าเหล่านี้เป็นระยะๆ และเขียนใหม่ให้อยู่ในรูปแบบมาตรฐาน นี่กลายเป็นพื้นฐานสำหรับ W3แค็ตตาล็อก?!ซึ่งเป็นเสิร์ชเอ็นจิ้นดั้งเดิมตัวแรกของเว็บ เปิดตัวเมื่อวันที่ 2 กันยายน พ.ศ. 2536

โปรแกรมรวบรวมข้อมูลเว็บตัวแรกที่เขียนด้วยภาษา Perl อาจเป็นบอท "World Wide Web Wanderer" โดย Matthew Gray ในเดือนมิถุนายน 1993 โรบอตตัวนี้สร้างดัชนีการค้นหา "Wandex" เป้าหมายของ Wanderer คือการวัดขนาดของเวิลด์ไวด์เว็บและค้นหาหน้าเว็บทั้งหมดที่มีคำจากข้อความค้นหา ในปี 1993 เครื่องมือค้นหาที่สอง "Aliweb" ปรากฏขึ้น Aliweb ไม่ได้ใช้โปรแกรมรวบรวมข้อมูล แต่คาดว่าจะได้รับการแจ้งเตือนจากผู้ดูแลเว็บไซต์เกี่ยวกับการมีไฟล์ดัชนีในรูปแบบใดรูปแบบหนึ่งบนเว็บไซต์ของตนแทน

จั๊มสเตชั่นสร้างขึ้นในเดือนธันวาคม พ.ศ. 2536 โดย Jonathan Fletcher ค้นหาและจัดทำดัชนีหน้าเว็บโดยใช้โปรแกรมรวบรวมข้อมูลเว็บ และใช้เว็บฟอร์มเป็นอินเทอร์เฟซสำหรับกำหนดคำค้นหา เป็นเครื่องมือค้นหาทางอินเทอร์เน็ตเครื่องแรกที่รวมฟังก์ชันที่สำคัญที่สุดสามประการของเครื่องมือค้นหาเข้าด้วยกัน (การตรวจสอบ การจัดทำดัชนี และการค้นหา) เนื่องจากทรัพยากรคอมพิวเตอร์ที่มีอยู่จำกัดในขณะนั้น การจัดทำดัชนีและการค้นหาจึงจำกัดอยู่เพียงชื่อเรื่องและชื่อเรื่องของหน้าเว็บที่โปรแกรมรวบรวมข้อมูลพบเท่านั้น

เครื่องมือค้นหามีส่วนร่วมใน "Dotcom Bubble" ในช่วงปลายทศวรรษ 1990 บริษัทหลายแห่งเข้าสู่ตลาดในรูปแบบที่น่าตื่นตาตื่นใจ โดยสร้างผลกำไรสูงสุดเป็นประวัติการณ์ในระหว่างการเสนอขายหุ้นแก่ประชาชนทั่วไปเป็นครั้งแรก บางคนละทิ้งตลาดเสิร์ชเอ็นจิ้นสาธารณะและเริ่มทำงานเฉพาะกับภาคองค์กรเท่านั้น เช่น ทางตอนเหนือของแสง.

Google นำแนวคิดการขายคำหลักมาใช้ในปี 1998 จากนั้นจึงเป็นบริษัทเล็กๆ ที่ให้บริการเครื่องมือค้นหาที่ goto.com การเคลื่อนไหวดังกล่าวถือเป็นการเปลี่ยนแปลงสำหรับเครื่องมือค้นหาจากการแข่งขันกันเองไปสู่การเป็นหนึ่งในธุรกิจที่ทำกำไรได้มากที่สุดบนอินเทอร์เน็ต เครื่องมือค้นหาเริ่มขายที่แรกในผลการค้นหาให้กับแต่ละบริษัท

เครื่องมือค้นหาของ Google โดดเด่นมาตั้งแต่ต้นทศวรรษ 2000 บริษัทได้รับตำแหน่งที่สูงเนื่องจากผลการค้นหาที่ดีโดยใช้อัลกอริธึม PageRank อัลกอริทึมนี้เผยแพร่สู่สาธารณะในบทความ "The Anatomy of Search Engine" ซึ่งเขียนโดย Sergey Brin และ Larry Page ผู้ก่อตั้ง Google อัลกอริธึมซ้ำนี้จะจัดอันดับหน้าเว็บตามการประมาณจำนวนไฮเปอร์ลิงก์ไปยังหน้าเว็บ ภายใต้สมมติฐานว่าหน้าที่ "ดี" และ "สำคัญ" มีลิงก์มากกว่าหน้าอื่นๆ อินเทอร์เฟซของ Google ได้รับการออกแบบในสไตล์สปาร์ตันซึ่งไม่มีอะไรฟุ่มเฟือย ไม่เหมือนคู่แข่งหลายรายที่สร้างเครื่องมือค้นหาลงในเว็บพอร์ทัล เครื่องมือค้นหาของ Google ได้รับความนิยมอย่างมากจนมีระบบลอกเลียนแบบปรากฏขึ้น เช่น ผู้แสวงหาความลึกลับ(เครื่องมือค้นหาลับ)

ค้นหาข้อมูลเป็นภาษารัสเซีย

ในปี 1996 การค้นหาได้ดำเนินการโดยคำนึงถึงสัณฐานวิทยาของรัสเซียในเครื่องมือค้นหา Altavista และเครื่องมือค้นหาดั้งเดิมของรัสเซีย Rambler และ Aport ได้เปิดตัว เมื่อวันที่ 23 กันยายน พ.ศ. 2540 เครื่องมือค้นหายานเดกซ์ได้เปิดขึ้น เมื่อวันที่ 22 พฤษภาคม 2014 Rostelecom ได้เปิดเครื่องมือค้นหาระดับชาติ Sputnik ซึ่งในปี 2558 อยู่ระหว่างการทดสอบเบต้า เมื่อวันที่ 22 เมษายน 2558 มีการเปิดตัวบริการใหม่ของสปุตนิก เด็กโดยเฉพาะสำหรับเด็กที่มีความปลอดภัยเพิ่มขึ้น

วิธีการวิเคราะห์คลัสเตอร์และการค้นหาข้อมูลเมตาได้รับความนิยมอย่างมาก ในบรรดารถยนต์สากลประเภทนี้ที่มีชื่อเสียงที่สุดคือ "คลัสเตอร์"บริษัท วิวิซิโม่. ในปี 2548 ในรัสเซีย โดยได้รับการสนับสนุนจากมหาวิทยาลัยแห่งรัฐมอสโก เครื่องมือค้นหา Nigma ได้เปิดตัว ซึ่งสนับสนุนการจัดกลุ่มอัตโนมัติ ในปี 2549 บริษัท Metamachine Quintura ของรัสเซียได้เปิดดำเนินการ โดยนำเสนอการจัดกลุ่มภาพในรูปแบบของแท็กคลาวด์ Nygma ยังทดลองการจัดกลุ่มภาพด้วย

เครื่องมือค้นหาทำงานอย่างไร?

ส่วนประกอบหลักของระบบการค้นหา: โรบ็อตการค้นหา, ตัวสร้างดัชนี, เครื่องมือค้นหา

โดยปกติแล้ว ระบบจะดำเนินการเป็นขั้นตอน ขั้นแรก โปรแกรมรวบรวมข้อมูลจะดึงเนื้อหา จากนั้นตัวสร้างดัชนีจะสร้างดัชนีที่ค้นหาได้ และสุดท้าย เครื่องมือค้นหาจะมีฟังก์ชันในการค้นหาข้อมูลที่จัดทำดัชนีไว้ หากต้องการอัปเดตเครื่องมือค้นหา จะมีการทำซ้ำรอบการจัดทำดัชนีนี้

เสิร์ชเอ็นจิ้นทำงานโดยการจัดเก็บข้อมูลเกี่ยวกับหน้าเว็บหลายหน้าซึ่งดึงมาจากหน้า HTML โรบ็อตการค้นหาหรือ "โปรแกรมรวบรวมข้อมูล" (อังกฤษ โปรแกรมรวบรวมข้อมูล) เป็นโปรแกรมที่จะผ่านลิงก์ทั้งหมดที่พบในหน้าและไฮไลต์ลิงก์เหล่านั้นโดยอัตโนมัติ โปรแกรมรวบรวมข้อมูลขึ้นอยู่กับลิงก์หรือตามรายการที่อยู่ที่กำหนดไว้ล่วงหน้า ค้นหาเอกสารใหม่ที่เครื่องมือค้นหายังไม่รู้จัก เจ้าของไซต์สามารถยกเว้นบางเพจได้โดยใช้ robots.txt ซึ่งสามารถใช้เพื่อป้องกันการจัดทำดัชนีไฟล์ เพจ หรือไดเร็กทอรีบนไซต์

เครื่องมือค้นหาจะวิเคราะห์เนื้อหาของแต่ละหน้าเพื่อจัดทำดัชนีเพิ่มเติม สามารถแยกคำออกจากชื่อเรื่อง ข้อความหน้า หรือฟิลด์พิเศษ - เมตาแท็ก ตัวสร้างดัชนีคือโมดูลที่วิเคราะห์เพจ โดยก่อนหน้านี้แบ่งออกเป็นส่วนต่างๆ โดยใช้อัลกอริธึมคำศัพท์และสัณฐานวิทยาของมันเอง องค์ประกอบทั้งหมดของหน้าเว็บจะถูกแยกและวิเคราะห์แยกกัน ข้อมูลหน้าเว็บจะถูกจัดเก็บไว้ในฐานข้อมูลดัชนีเพื่อใช้ในการสืบค้นครั้งต่อไป ดัชนีช่วยให้คุณค้นหาข้อมูลตามคำขอของผู้ใช้ได้อย่างรวดเร็ว เสิร์ชเอ็นจิ้นจำนวนหนึ่ง เช่น Google จัดเก็บหน้าเดิมทั้งหมดหรือบางส่วน ซึ่งเรียกว่าแคช รวมถึงข้อมูลต่างๆ เกี่ยวกับหน้าเว็บนั้น ระบบอื่นๆ เช่น AltaVista จะจัดเก็บทุกคำจากทุกหน้าที่พบ การใช้แคชช่วยเพิ่มความเร็วในการดึงข้อมูลจากหน้าที่เยี่ยมชมแล้ว เพจที่แคชไว้จะมีข้อความที่ผู้ใช้ระบุในคำค้นหาเสมอ สิ่งนี้มีประโยชน์ในกรณีที่หน้าเว็บได้รับการอัปเดตนั่นคือไม่มีข้อความคำขอของผู้ใช้อีกต่อไปและหน้าในแคชยังเก่าอยู่ สถานการณ์นี้เกี่ยวข้องกับการสูญเสียลิงก์ (Eng. ลิงค์ร็อต) และแนวทางที่เป็นมิตรต่อผู้ใช้ (การใช้งาน) ของ Google สิ่งนี้เกี่ยวข้องกับการส่งคืนส่วนของข้อความสั้นจากแคชที่มีข้อความคำขอ ใช้หลักการสร้างความประหลาดใจน้อยที่สุด โดยปกติผู้ใช้คาดหวังว่าจะเห็นคำที่ค้นหาในข้อความของหน้าเว็บที่ได้รับ ( ความคาดหวังของผู้ใช้). นอกเหนือจากข้อเท็จจริงที่ว่าการใช้หน้าที่แคชไว้จะช่วยเพิ่มความเร็วในการค้นหา หน้าที่แคชไว้อาจมีข้อมูลที่ไม่มีอยู่ในที่อื่นอีกต่อไป

เครื่องมือค้นหาทำงานร่วมกับไฟล์เอาต์พุตที่ได้รับจากตัวสร้างดัชนี เสิร์ชเอ็นจิ้นยอมรับคำค้นหาของผู้ใช้ ประมวลผลโดยใช้ดัชนี และส่งกลับผลลัพธ์การค้นหา

เมื่อผู้ใช้ป้อนคำค้นหาลงในเครื่องมือค้นหา (โดยปกติจะใช้คำหลัก) ระบบจะตรวจสอบดัชนีและส่งคืนรายการหน้าเว็บที่เกี่ยวข้องมากที่สุด (จัดเรียงตามเกณฑ์บางประการ) โดยปกติจะมีข้อมูลสรุปสั้นๆ ที่มีชื่อเรื่องของเอกสารและ บางครั้งข้อความบางส่วน ดัชนีการค้นหาถูกสร้างขึ้นโดยใช้เทคนิคพิเศษตามข้อมูลที่ดึงมาจากหน้าเว็บ ตั้งแต่ปี 2550 เครื่องมือค้นหาของ Google ช่วยให้คุณค้นหาตามเวลาโดยสร้างเอกสารที่คุณกำลังมองหา (เรียกว่าเมนู "เครื่องมือค้นหา" และระบุช่วงเวลา) เครื่องมือค้นหาส่วนใหญ่สนับสนุนการใช้ตัวดำเนินการบูลีน AND, OR, NOT ในข้อความค้นหา ซึ่งช่วยให้คุณสามารถปรับแต่งหรือขยายรายการคำหลักที่ค้นหาได้ ในกรณีนี้ระบบจะค้นหาคำหรือวลีตามที่กรอกทุกประการ เครื่องมือค้นหาบางรายการมีตัวเลือก การค้นหาโดยประมาณในกรณีนี้ ผู้ใช้จะขยายพื้นที่การค้นหาโดยระบุระยะทางไปยังคีย์เวิร์ด นอกจากนี้ยังมี การค้นหาแนวความคิดซึ่งใช้การวิเคราะห์ทางสถิติของการใช้คำและวลีที่ค้นหาในข้อความของหน้าเว็บ ระบบเหล่านี้อนุญาตให้เขียนคำถามเป็นภาษาธรรมชาติได้ ตัวอย่างของเครื่องมือค้นหาดังกล่าวคือไซต์ Ask com

ประโยชน์ของเครื่องมือค้นหาขึ้นอยู่กับความเกี่ยวข้องของหน้าเว็บที่พบ แม้ว่าหน้าเว็บหลายล้านหน้าอาจมีคำหรือวลีที่กำหนด แต่บางหน้าก็อาจมีความเกี่ยวข้อง เป็นที่นิยม หรือน่าเชื่อถือมากกว่าหน้าอื่นๆ เครื่องมือค้นหาส่วนใหญ่ใช้วิธีการจัดอันดับเพื่อนำผลลัพธ์ที่ "ดีที่สุด" มาอยู่ด้านบนสุดของรายการ เครื่องมือค้นหาจะตัดสินว่าหน้าใดมีความเกี่ยวข้องมากกว่า และควรแสดงผลลัพธ์ตามลำดับใดในรูปแบบที่แตกต่างกัน วิธีค้นหา เช่น อินเทอร์เน็ต มีการเปลี่ยนแปลงอยู่ตลอดเวลา นี่คือวิธีที่เครื่องมือค้นหาสองประเภทหลักเกิดขึ้น: ระบบของคำหลักและระบบที่กำหนดไว้ล่วงหน้าและตามลำดับชั้นซึ่งสร้างดัชนีแบบกลับด้านตามการวิเคราะห์ข้อความ

เสิร์ชเอ็นจิ้นส่วนใหญ่เป็นองค์กรเชิงพาณิชย์ที่ทำกำไรจากการโฆษณา ในเสิร์ชเอ็นจิ้นบางรายการคุณสามารถซื้อที่แรกในผลการค้นหาสำหรับคีย์เวิร์ดที่ระบุโดยเสียค่าธรรมเนียม เครื่องมือค้นหาที่ไม่เรียกเก็บเงินสำหรับลำดับการออกผลลัพธ์สร้างรายได้จากการโฆษณาตามบริบท ในขณะที่ข้อความโฆษณาสอดคล้องกับคำขอของผู้ใช้ โฆษณาดังกล่าวจะแสดงบนหน้าเว็บพร้อมรายการผลการค้นหา และเครื่องมือค้นหาจะได้รับเงินทุกครั้งที่ผู้ใช้คลิกข้อความโฆษณา

ประเภทเครื่องมือค้นหา

เครื่องมือค้นหามีสี่ประเภท: หุ่นยนต์, ขับเคลื่อนโดยมนุษย์, ไฮบริดและเมตาดาต้า

  • ระบบที่ใช้โรบ็อตการค้นหา
ประกอบด้วยสามส่วน: โปรแกรมรวบรวมข้อมูล ("บอท", "หุ่นยนต์" หรือ "สไปเดอร์"), ดัชนีและซอฟต์แวร์เครื่องมือค้นหา จำเป็นต้องมีโปรแกรมรวบรวมข้อมูลเพื่อรวบรวมข้อมูลเว็บและสร้างรายการหน้าเว็บ ดัชนีคือแหล่งเก็บสำเนาหน้าเว็บขนาดใหญ่ วัตถุประสงค์ของซอฟต์แวร์คือเพื่อประเมินผลการค้นหา เนื่องจากหุ่นยนต์ค้นหาในกลไกนี้สำรวจเครือข่ายอยู่ตลอดเวลา ข้อมูลจึงมีความเกี่ยวข้องมากขึ้น เครื่องมือค้นหาที่ทันสมัยที่สุดคือระบบประเภทนี้
  • ระบบการจัดการโดยมนุษย์ (ไดเร็กทอรีทรัพยากร)
เครื่องมือค้นหาเหล่านี้จะดึงรายการหน้าเว็บ ไดเรกทอรีประกอบด้วยที่อยู่ ชื่อเรื่อง และคำอธิบายโดยย่อของเว็บไซต์ ไดเรกทอรีทรัพยากรจะค้นหาเฉพาะผลลัพธ์จากคำอธิบายหน้าที่ส่งโดยผู้ดูแลเว็บเท่านั้น ข้อดีของแคตตาล็อกคือทรัพยากรทั้งหมดได้รับการตรวจสอบด้วยตนเอง ดังนั้นคุณภาพของเนื้อหาจะดีกว่าเมื่อเทียบกับผลลัพธ์ที่ได้รับโดยอัตโนมัติจากระบบประเภทแรก แต่ก็มีข้อเสียเช่นกัน - การอัปเดตข้อมูลแค็ตตาล็อกทำได้ด้วยตนเองและอาจล้าหลังสถานการณ์จริงได้อย่างมาก อันดับเพจไม่สามารถเปลี่ยนแปลงได้ทันที ตัวอย่างของระบบดังกล่าว ได้แก่ ไดเรกทอรี Yahoo, ดีมอซ และกาแล็กซี่
  • ระบบไฮบริด
เครื่องมือค้นหาเช่น Yahoo, Google, MSN รวมฟังก์ชันของระบบโดยใช้โรบ็อตการค้นหาและระบบที่ดำเนินการโดยมนุษย์
  • เมตาดาต้าซิสเต็มส์
โปรแกรม Metasearch จะรวมและจัดอันดับผลลัพธ์ของโปรแกรมค้นหาหลายรายการพร้อมกัน เครื่องมือค้นหาเหล่านี้มีประโยชน์เมื่อเครื่องมือค้นหาแต่ละรายการมีดัชนีเฉพาะและเครื่องมือค้นหามีความ "ฉลาด" น้อยกว่า เนื่องจากการค้นหาได้รับการปรับปรุงอย่างมากในขณะนี้ ความต้องการการค้นหาจึงลดลง ตัวอย่าง: MetaCrawlerและการค้นหา MSN

ตลาดเครื่องมือค้นหา

Google เป็นเครื่องมือค้นหาที่ได้รับความนิยมมากที่สุดในโลกโดยมีส่วนแบ่งตลาด 68.69% Bing อยู่ในอันดับที่สองด้วยส่วนแบ่ง 12.26%

เครื่องมือค้นหาที่ได้รับความนิยมมากที่สุดในโลก:

ระบบค้นหา ส่วนแบ่งการตลาดในเดือนกรกฎาคม 2557 ส่วนแบ่งตลาดเดือนตุลาคม 2557 ส่วนแบ่งตลาดเดือนกันยายน 2558
Google 68,69 % 58,01 % 69,24%
ไป่ตู้ 17,17 % 29,06 % 6,48%
ปิง 6,22 % 8,01 % 12,26%
ยาฮู! 6,74 % 4,01 % 9,19%
เอโอแอล 0,13 % 0,21 % 1,11%
ตื่นเต้น 0,22 % 0,00 % 0,00 %
ถาม 0,13 % 0,10 % 0,24%

เอเชีย

ในประเทศแถบเอเชียตะวันออกและรัสเซีย Google ไม่ใช่เครื่องมือค้นหาที่ได้รับความนิยมมากที่สุด ตัวอย่างเช่นในประเทศจีนได้รับความนิยมมากขึ้น เครื่องมือค้นหา Soso?!.

ในเกาหลีใต้ พอร์ทัลการค้นหาของ Naver ถูกใช้โดย Yahoo! ประมาณ 70% ญี่ปุ่นและ Yahoo! ไต้หวันเป็นเครื่องมือค้นหายอดนิยมในญี่ปุ่นและไต้หวันตามลำดับ

เครื่องมือค้นหาภาษารัสเซียและภาษารัสเซีย

ตามข้อมูล LiveInternet ในเดือนมิถุนายน 2558 เกี่ยวกับการครอบคลุมข้อความค้นหาภาษารัสเซีย:

  • ทุกภาษา:
    • ยาฮู! (0.1%) และเครื่องมือค้นหาที่เป็นของบริษัทนี้: อิงค์โทมิ,อัลตาวิสต้า, ออลเดอะเว็บ
  • ภาษาอังกฤษและภาษาต่างประเทศ:
    • ถามจีฟส์(เครื่องยนต์เทมา)
  • เครื่องมือค้นหาที่พูดภาษารัสเซีย - ดัชนีเครื่องมือค้นหา "ภาษารัสเซีย" ส่วนใหญ่และค้นหาข้อความในหลายภาษา - ยูเครน, เบลารุส, อังกฤษ, ตาตาร์และอื่น ๆ พวกเขาแตกต่างจากระบบ “ทุกภาษา” ที่สร้างดัชนีเอกสารทั้งหมดติดต่อกันโดยส่วนใหญ่จะจัดทำดัชนีทรัพยากรที่ตั้งอยู่ในโซนโดเมนที่ภาษารัสเซียครอบงำ หรือในทางอื่น ๆ จำกัดหุ่นยนต์ของพวกเขาให้อยู่ในไซต์ภาษารัสเซีย

เครื่องมือค้นหาบางตัวใช้อัลกอริธึมการค้นหาภายนอก

ข้อมูลเชิงปริมาณจากเครื่องมือค้นหาของ Google

จำนวนผู้ใช้อินเทอร์เน็ตและเครื่องมือค้นหาและข้อกำหนดของผู้ใช้สำหรับระบบเหล่านี้มีการเติบโตอย่างต่อเนื่อง เพื่อเพิ่มความเร็วในการค้นหาข้อมูลที่จำเป็น เสิร์ชเอ็นจิ้นขนาดใหญ่จึงมีเซิร์ฟเวอร์จำนวนมาก โดยปกติเซิร์ฟเวอร์จะถูกจัดกลุ่มเป็นศูนย์เซิร์ฟเวอร์ (ศูนย์ข้อมูล) เครื่องมือค้นหายอดนิยมมีศูนย์เซิร์ฟเวอร์กระจายอยู่ทั่วโลก

ในเดือนตุลาคม พ.ศ. 2555 Google ได้เปิดตัวโครงการ "Where the Internet Lives" ซึ่งผู้ใช้จะได้รับโอกาสในการสำรวจศูนย์ข้อมูลของบริษัท

เครื่องมือค้นหาของ Google รู้สิ่งต่อไปนี้เกี่ยวกับการทำงานของศูนย์ข้อมูล:

  • ความจุรวมของศูนย์ข้อมูล Google ทั้งหมด ณ ปี 2554 อยู่ที่ประมาณ 220 MW
  • เมื่อ Google วางแผนที่จะเปิดคอมเพล็กซ์แห่งใหม่ในรัฐโอเรกอนในปี 2551 ซึ่งประกอบด้วยอาคาร 3 หลัง พื้นที่รวม 6.5 ล้านตารางเมตร นิตยสาร Harper's Magazine คาดการณ์ว่าคอมเพล็กซ์ขนาดใหญ่ดังกล่าวจะใช้ไฟฟ้ามากกว่า 100 เมกะวัตต์ ซึ่งเทียบได้กับพลังงาน การบริโภคของเมืองที่มีประชากร 300,000 คน
  • จำนวนเซิร์ฟเวอร์ Google โดยประมาณในปี 2555 คือ 1,000,000 แห่ง
  • ค่าใช้จ่ายของ Google ในศูนย์ข้อมูลอยู่ที่ 1.9 พันล้านดอลลาร์ในปี 2549 และ 2.4 พันล้านดอลลาร์ในปี 2550

ขนาดของเวิลด์ไวด์เว็บที่จัดทำดัชนีโดย Google ณ เดือนธันวาคม 2014 อยู่ที่ประมาณ 4.36 พันล้านหน้า

เครื่องมือค้นหาที่คำนึงถึงข้อห้ามทางศาสนา

การแพร่กระจายของอินเทอร์เน็ตไปทั่วโลกและความนิยมที่เพิ่มขึ้นของอุปกรณ์อิเล็กทรอนิกส์ในโลกอาหรับและมุสลิม โดยเฉพาะอย่างยิ่งในประเทศตะวันออกกลางและอนุทวีปอินเดีย มีส่วนทำให้เกิดการพัฒนาเครื่องมือค้นหาในท้องถิ่นที่คำนึงถึงประเพณีของศาสนาอิสลาม เครื่องมือค้นหาดังกล่าวมีตัวกรองพิเศษที่ช่วยให้ผู้ใช้หลีกเลี่ยงการเยี่ยมชมไซต์ต้องห้าม เช่น ไซต์ที่มีภาพอนาจาร และอนุญาตให้ผู้ใช้ใช้เฉพาะไซต์ที่มีเนื้อหาไม่ขัดแย้งกับศรัทธาของศาสนาอิสลาม ก่อนเดือนรอมฎอนของชาวมุสลิมในเดือนกรกฎาคม 2556 โลกได้ถูกนำมาใช้ ฮาลาลกูเกิล- ระบบที่ให้ผู้ใช้มีลิงก์ "ถูกต้อง" แบบฮาลาลเท่านั้น โดยกรองผลการค้นหาที่ได้รับจากเครื่องมือค้นหาอื่น ๆ เช่น Google และ Bing เมื่อสองปีก่อน ในเดือนกันยายน พ.ศ. 2554 เครื่องมือค้นหา I'mHalal ได้เปิดตัวเพื่อให้บริการผู้ใช้ในตะวันออกกลาง อย่างไรก็ตาม เจ้าของระบุว่าบริการค้นหานี้จะต้องปิดตัวลงในเร็วๆ นี้ เนื่องจากขาดเงินทุน

การขาดการลงทุนและการแพร่กระจายเทคโนโลยีที่ช้าในโลกมุสลิมได้ขัดขวางความก้าวหน้าและขัดขวางความสำเร็จของเครื่องมือค้นหาอิสลามอย่างจริงจัง ความล้มเหลวของการลงทุนจำนวนมากในโครงการเว็บไลฟ์สไตล์ของชาวมุสลิม ซึ่งหนึ่งในนั้นคือ มักสลิม. เขาได้รับเงินหลายล้านดอลลาร์จากนักลงทุนเช่น Rite Internet Ventures และตอนนี้ - ตามโพสต์ล่าสุดจาก I'mHalal ก่อนที่จะปิดตัวลง - เกิดความคิดที่น่าสงสัยขึ้นมาว่า "Facebook หรือ Google ถัดไปอาจมีเฉพาะในตะวันออกกลางเท่านั้น . หากคุณสนับสนุนเยาวชนที่เก่งของเรา” อย่างไรก็ตาม ผู้เชี่ยวชาญด้านอินเทอร์เน็ตอิสลามยุ่งอยู่กับการกำหนดสิ่งที่เป็นไปตามหลักอิสลามหรือไม่ และจัดประเภทเว็บไซต์เป็น "ฮาลาล" หรือ "ฮารอม" เครื่องมือค้นหาอิสลามในอดีตและปัจจุบันทั้งหมดเป็นเพียงชุดข้อมูลที่มีการจัดทำดัชนีเป็นพิเศษ หรือเป็นเครื่องมือค้นหาหลัก เช่น Google, Yahoo และ Bing ที่มีระบบกรองบางประเภทที่ใช้ป้องกันไม่ให้ผู้ใช้เข้าถึงไซต์ฮารัม เช่น ไซต์เกี่ยวกับภาพเปลือย LGBT การพนัน และอื่นๆ ที่ถือว่าเป็นการต่อต้านอิสลาม

ในบรรดาเครื่องมือค้นหาที่เกี่ยวข้องกับศาสนาอื่นๆ Jewogle ซึ่งเป็น Google เวอร์ชันยิว และ SeekFind.org ซึ่งเป็นไซต์คริสเตียนที่มีตัวกรองเพื่อป้องกันไม่ให้ผู้ใช้เข้าถึงเนื้อหาที่อาจบ่อนทำลายหรือทำให้ศรัทธาของพวกเขาอ่อนแอลง ถือเป็นเรื่องปกติ

ผลลัพธ์ส่วนบุคคลและฟองกรอง

เครื่องมือค้นหาจำนวนมาก เช่น Google และ Bing ใช้อัลกอริธึมเพื่อเลือกเดาว่าข้อมูลใดที่ผู้ใช้ต้องการเห็นโดยพิจารณาจากกิจกรรมที่ผ่านมาในระบบ ด้วยเหตุนี้ เว็บไซต์จึงแสดงเฉพาะข้อมูลที่สอดคล้องกับความสนใจในอดีตของผู้ใช้เท่านั้น เอฟเฟกต์นี้เรียกว่า "ฟองอากาศตัวกรอง"

ทั้งหมดนี้นำไปสู่ความจริงที่ว่าผู้ใช้ได้รับข้อมูลที่ขัดแย้งกับมุมมองของตนน้อยกว่ามากและถูกแยกออกจากกันทางสติปัญญาใน "ฟองสบู่ข้อมูล" ของตนเอง ดังนั้น "เอฟเฟกต์ฟองสบู่" อาจส่งผลเสียต่อการสร้างความคิดเห็นของพลเมือง

อคติของเครื่องมือค้นหา

แม้ว่าเครื่องมือค้นหาจะได้รับการตั้งโปรแกรมให้จัดอันดับเว็บไซต์โดยพิจารณาจากความนิยมและความเกี่ยวข้องร่วมกัน แต่ในความเป็นจริงแล้ว การวิจัยเชิงทดลองบ่งชี้ว่าปัจจัยทางการเมือง เศรษฐกิจ และสังคมต่างๆ มีอิทธิพลต่อผลการค้นหา

อคตินี้อาจเป็นผลโดยตรงจากกระบวนการทางเศรษฐกิจและเชิงพาณิชย์: บริษัทที่โฆษณาบนเครื่องมือค้นหาอาจได้รับความนิยมมากขึ้นในผลการค้นหาทั่วไปบนเครื่องมือค้นหา การลบผลการค้นหาที่ไม่ปฏิบัติตามกฎหมายท้องถิ่นเป็นตัวอย่างหนึ่งของอิทธิพลของกระบวนการทางการเมือง ตัวอย่างเช่น Google จะไม่แสดงเว็บไซต์นีโอนาซีบางแห่งในฝรั่งเศสและเยอรมนี ซึ่งการปฏิเสธการฆ่าล้างเผ่าพันธุ์ถือเป็นสิ่งผิดกฎหมาย

อคติยังอาจเป็นผลมาจากกระบวนการทางสังคม เนื่องจากอัลกอริทึมของเครื่องมือค้นหามักได้รับการออกแบบมาเพื่อแยกมุมมองที่ไม่ได้จัดรูปแบบออกไปเพื่อสนับสนุนผลลัพธ์ที่ "ได้รับความนิยม" มากกว่า อัลกอริธึมการจัดทำดัชนีของเครื่องมือค้นหาหลัก ๆ ให้ความสำคัญกับไซต์ในอเมริกา

การวางระเบิดการค้นหาเป็นตัวอย่างหนึ่งของความพยายามที่จะบิดเบือนผลการค้นหาด้วยเหตุผลทางการเมือง สังคม หรือเชิงพาณิชย์

ดูสิ่งนี้ด้วย

  • ควิกา
  •  libraryอิเล็กทรอนิกส์#Lists of libraries และ search engines
  • แถบเครื่องมือนักพัฒนาเว็บ

หมายเหตุ

วรรณกรรม

  • Ashmanov I. S. , Ivanov A. A.การโปรโมตเว็บไซต์ในเครื่องมือค้นหา - ม. : วิลเลียมส์, 2550. - 304 น. - ISBN 978-5-8459-1155-1.
  • เบย์คอฟ วี.ดี.อินเทอร์เน็ต. ค้นหาข้อมูล การโปรโมตเว็บไซต์ - เซนต์ปีเตอร์สเบิร์ก. : BHV-Petersburg, 2000. - 288 หน้า - ISBN 5-8206-0095-9.
  • โคลิสนิเชนโก้ ดี. เอ็น.โปรแกรมค้นหาและโปรโมทเว็บไซต์บนอินเตอร์เน็ต - อ.: วิภาษวิธี 2550 - 272 หน้า - ISBN 978-5-8459-1269-5.
  • Lande D.V.ค้นหาความรู้บนอินเทอร์เน็ต - อ.: วิภาษวิธี, 2548. - 272 น. - ISBN 5-8459-0764-0.
  • Lande D.V., Snarsky A.A., Bezsudnov I.V.อินเทอร์เน็ต: การนำทางในเครือข่ายที่ซับซ้อน: โมเดลและอัลกอริธึม - อ.: Librocom (บรรณาธิการ URSS), 2552. - 264 หน้า - ISBN 978-5-397-00497-8.
  • ชู เอช., โรเซนธาล เอ็ม.

บทความที่คล้ายกัน