Ποια είναι η παλαιότερη μηχανή αναζήτησης. Ρωσικές μηχανές αναζήτησης. Αυτοί που βρίσκονται στη σκιά

Σε μια εποχή που μόλις ξεκινούσε η ανάπτυξη του Διαδικτύου, ο όγκος των διαθέσιμων πληροφοριών ήταν σχετικά μικρός και οι χρήστες του δικτύου ήταν λίγοι. Στα αρχικά στάδια της ανάπτυξης του δικτύου, χρησιμοποιήθηκε από υπαλλήλους πανεπιστημίων και ερευνητικών εργαστηρίων για την ανταλλαγή πληροφοριών μεταξύ ιδρυμάτων. Εκείνη την εποχή, η αναζήτηση πληροφοριών στο Διαδίκτυο δεν ήταν σχετική, σε αντίθεση με σήμερα.

Ο πρώτος τρόπος οργάνωσης και συστηματοποίησης της πρόσβασης σε πόρους πληροφοριών ήταν η δημιουργία καταλόγων τοποθεσιών. Άρχισαν να ομαδοποιούν συνδέσμους σύμφωνα με ένα συγκεκριμένο θέμα.

Η περιοχή πρωτοστάτησε από τη Yahoo, η οποία εμφανίστηκε τον Απρίλιο του 1994. Όσο περνούσε ο καιρός, ο αριθμός των τοποθεσιών μεγάλωνε και η Yahoo πρόσθεσε μια επιλογή αναζήτησης καταλόγου. Δεν ήταν μηχανή αναζήτησης με την πραγματική έννοια, επειδή το εύρος της αναζήτησης περιοριζόταν στους πόρους του καταλόγου.

Στη συνέχεια, οι κατάλογοι εξαπλώθηκαν και άρχισαν να χρησιμοποιούνται παντού, αλλά το Διαδίκτυο δεν έμεινε ακίνητο, αλλά συνέχισε να αναπτύσσεται. Μαζί με αυτό, αναπτύχθηκαν και μέθοδοι αναζήτησης. Προς το παρόν, οι κατάλογοι έχουν σχεδόν χάσει τη δημοτικότητά τους, αυτό οφείλεται στο γεγονός ότι ένας σύγχρονος κατάλογος, ακόμα κι αν περιέχει τεράστιο όγκο πόρων, θα είναι σε θέση να παρέχει πρόσβαση μόνο σε ένα μικρό μέρος των πληροφοριών που περιέχονται στο το δίκτυο.

Σήμερα, ο μεγαλύτερος κατάλογος στον Ιστό είναι το Open Directory Project ή DMOZ, το οποίο περιλαμβάνει πληροφορίες για 5 εκατομμύρια πόρους, αλλά αυτό είναι σχετικά μικρό σε σύγκριση, για παράδειγμα, με τη μηχανή αναζήτησης Google, η οποία περιέχει περίπου 8 δισεκατομμύρια έγγραφα.

Μια πλήρης μηχανή αναζήτησης κυκλοφόρησε μόνο το 1994, έγινε η μηχανή αναζήτησης WebCrawler.

Ένα χρόνο αργότερα, το 1995, εμφανίστηκαν τα έργα μηχανών αναζήτησης AltaVista και Lycos. Ένα από αυτά, και συγκεκριμένα η AltaVista, κατέχει την ηγετική θέση στην αναζήτηση για πολλά χρόνια.

Δύο χρόνια αργότερα, το 1997, οι φοιτητές του Πανεπιστημίου Στάνφορντ Σεργκέι Μπριν και Λάρι Πέιτζ ανέπτυξαν τη μηχανή αναζήτησης Google, η οποία είναι ο ηγέτης στην αναζήτηση σήμερα.

Φέτος έγινε επίσης η χρονιά που ανακοινώθηκε επίσημα η δημιουργία της ρωσικής μηχανής αναζήτησης Yandex, η οποία εξακολουθεί να είναι ο ηγέτης στο ρωσόφωνο τμήμα του δικτύου.

Αυτή τη στιγμή, υπάρχουν μόνο 3 μηχανές αναζήτησης που έχουν γίνει διεθνείς, αυτές είναι η MSN Search, η Yahoo και η Google. Αυτά τα συστήματα έχουν τις δικές τους βάσεις και αλγόριθμους αναζήτησης. Οι περισσότερες άλλες μηχανές αναζήτησης χρησιμοποιούν τα αποτελέσματά τους. Έτσι, το Mail.ru χρησιμοποιεί τη βάση δεδομένων Yandex, search.aol.com - Google και Lycos, AltaVista και AllTheWeb - Yahoo.

Η Yandex είναι αυτή τη στιγμή ο ηγέτης στην αναζήτηση στο ρωσικό Διαδίκτυο, ακολουθούμενη από τη Rambler, ακολουθούμενη από τις Google, Mail.ru, Aport και KM.ru.

Οι μηχανές αναζήτησης έχουν διαφορετικούς αλγόριθμους εργασίας και για να πάρετε μια καλή θέση στα αποτελέσματα αναζήτησης και να προσελκύσετε στοχευμένους επισκέπτες, πρέπει να γνωρίζετε τα χαρακτηριστικά της βελτιστοποίησης SEO για διαφορετικές μηχανές αναζήτησης. Για παράδειγμα

Στα πρώτα χρόνια της ανάπτυξης της κοινότητας του Διαδικτύου, οι ενεργοί χρήστες του Διαδικτύου αποτελούσαν μειοψηφία και ο όγκος των πληροφοριών σχετικά με τους πόρους του Διαδικτύου ήταν σχετικά μικρός. Ως επί το πλείστον, μόνο οι εργαζόμενοι σε επιστημονικά εργαστήρια και μεγάλα εκπαιδευτικά ιδρύματα είχαν πρόσβαση στο παγκόσμιο δίκτυο πληροφοριών. Γενικά, η χρήση ενός πόρου δικτύου δεν ήταν τόσο σχετική όσο είναι σήμερα.

Ιστορία των μηχανών αναζήτησης

Ένα μεγάλο βήμα προς τη διάδοση του Διαδικτύου στις μάζες ήταν η εμφάνιση το 1990 της ιστοσελίδας info.centr.ch. Αυτός ο ιστότοπος ήταν ο πρώτος δημόσιος κατάλογος δικτυακών τόπων. Δημιουργός είναι ο Βρετανός επιστήμονας Tim Berners-Lee, ο οποίος θεωρείται επίσης ο δημιουργός των URI, HTTP, World Wide Web και URL. Από εκείνη τη στιγμή, οι ιστότοποι του Διαδικτύου έχουν γίνει σχετικοί όχι μόνο σε εξειδικευμένους κύκλους χρηστών, αλλά και μεταξύ των απλών ιδιοκτητών οικιακών υπολογιστών. Σε αυτόν τον κατάλογο, για διευκόλυνση, έχουν οργανωθεί πόροι πληροφοριών με βάση ομάδες για παρόμοια θέματα, γεγονός που διευκολύνει πολύ την αναζήτηση πληροφοριών.

Όμως η πρόοδος δεν σταμάτησε εκεί και το 1994 γεννήθηκε η τεχνολογία αναζήτησης που αναπτύχθηκε από το Πανεπιστήμιο Carnegie, γνωστή ως Lucos. Αυτός ο κατάλογος, ο οποίος δημιουργήθηκε από τον Michael Maldin, ξεκίνησε με έναν πόρο με περισσότερα από 50.000 έγγραφα. Στο Lucos, τα ερωτήματα θεωρήθηκαν ως αντιστοιχίσεις κατά προσέγγιση του ερωτήματος και το αποτέλεσμα αναζήτησης ταξινομήθηκε ανάλογα με την αντιστοίχιση μεταξύ των πληροφοριών εισόδου και εξόδου. Και επίσης, υπήρξε μια συνεχής αναπλήρωση του πόρου με νέες σελίδες στο Διαδίκτυο. Μέχρι τον Νοέμβριο, ο Lucos είχε πάνω από 55 εκατομμύρια σελίδες και έγγραφα, πολύ περισσότερες από οποιονδήποτε κατάλογο εγγράφων της ημέρας.

Στα τέλη του 1994, εμφανίστηκε ο πόρος Infosek. Είχε μια σειρά από πλεονεκτήματα σε σχέση με άλλους πόρους. Για παράδειγμα, η προσθήκη τοποθεσιών από τον χρήστη στη βάση δεδομένων του καταλόγου σε πραγματικό χρόνο.

Το νέο τέρας της μηχανής αναζήτησης το 1995 ήταν η AltaVista. Γρήγορα κέρδισε δημοτικότητα μεταξύ των χρηστών του Διαδικτύου και κατέλαβε ηγετική θέση στον τομέα της. Το κύριο χαρακτηριστικό του ήταν η δυνατότητα διατύπωσης ερωτημάτων σε μια φυσική, καθομιλουμένη γλώσσα, καθώς και οι χρήστες είχαν τη δυνατότητα να προσθέσουν τις δικές τους διευθύνσεις URL. Ωστόσο, το κύριο πλεονέκτημα της AltaVista ήταν η υποστήριξη πολλαπλών πακέτων γλωσσών, όπως τα κορεάτικα, τα ιαπωνικά και τα κινέζικα, καθώς και τα ρωσικά.

Ένα τεράστιο βήμα στην τεχνολογία αναζήτησης ήταν η εμφάνιση στο Διαδίκτυο μιας νέας μηχανής αναζήτησης, το όνομα της οποίας ακούγεται πλέον από κάθε χρήστη, δηλαδή το Google. Το 1997, ο L. Page και ο S. Brin από το Πανεπιστήμιο του Στάνφορντ εισήγαγαν νέα χαρακτηριστικά στους αλγόριθμους αναζήτησης των απογόνων τους. Στην αναζήτηση χρησιμοποιήθηκαν συστήματα συνάφειας των αποτελεσμάτων αναζήτησης που εκδόθηκαν από το σύστημα και λήφθηκαν υπόψη η μορφολογία και τα πιθανά ορθογραφικά λάθη κατά την υποβολή ερωτημάτων.

Υπάρχουν τρεις σημαντικοί ηγέτες στην αγορά των μηχανών αναζήτησης αυτές τις μέρες: Bing, Google και Yahoo. Έχουν στη διάθεσή τους αλγόριθμους αναζήτησης και βάσεις δεδομένων δικής τους παραγωγής. Πολλές μηχανές αναζήτησης, από τις οποίες υπάρχουν πολλές, χρησιμοποιούν τις εξελίξεις αυτών των τριών τιτάνων μεταξύ των μηχανών αναζήτησης.

Χάρη στις μηχανές αναζήτησης, έχει γίνει ευκολότερο για έναν απλό άνθρωπο να ανακαλύψει τις τεράστιες εκτάσεις του πεδίου πληροφοριών. Χωρίς την ανάπτυξή τους, είναι αδύνατο να βελτιωθούν οι τρόποι ανταλλαγής πληροφοριών μεταξύ των ανθρώπων.

Ποια ήταν η πρώτη μηχανή αναζήτησης στο Runet; Yandex, Aport ή Rambler;

Οι πρώτες μηχανές αναζήτησης Runet (από τις οποίες, σύμφωνα με έναν από τους ιδρυτές της Rambler, υπήρχαν 2 ή 3) πολύ γρήγορα βυθίστηκαν στη λήθη. Ανάμεσά τους ήταν μορφολογικές προεκτάσεις του συστήματος AltaVista, που δεν μας άφησαν τα ονόματά τους. Επομένως, θα πρέπει να επιλέξουμε από αυτούς που θα μείνουν:

Περιπλανώμενος υποκείμενο

Η δημιουργία του "Rambler" ξεκίνησε το 1996, όταν υπήρχαν μόνο μερικές δεκάδες τοποθεσίες στο ρωσικό τμήμα του Διαδικτύου. Η ανάπτυξη ολοκληρώθηκε το φθινόπωρο του ίδιου έτους. Ο τομέας rambler.ru καταχωρήθηκε στις 26 Σεπτεμβρίου και 8 Οκτωβρίου 1996, στα γενέθλια ενός από τους δημιουργούς, το Rambler ήταν ανοιχτό στους χρήστες.

Rambler - η πρώτη μηχανή αναζήτησης στο Runetαπό αυτά που υπάρχουν σήμερα.

Η μηχανή αναζήτησης Aport αναπτύχθηκε τον Φεβρουάριο του 1996, αλλά εκείνη την εποχή έκανε αναζήτηση μόνο στον ιστότοπο russia.agama.com. Σταδιακά, ο αριθμός των τοποθεσιών αυξήθηκε και με το επίσημο άνοιγμα 11 Νοεμβρίου 1997χρόνια, το "Aport" αναζητούσε ήδη 10.000 τοποθεσίες. Έτσι, το "Aport" ήταν μια από τις πρώτες μηχανές αναζήτησης στο Runet, αλλά λόγω του περιορισμένου εύρους της αναζήτησης, δεν μπορεί να αναγνωριστεί ως η παλαιότερη.

Yandex

Η CompTek, η οποία ανέπτυξε το Yandex, ιδρύθηκε το 1989. Το 1993, η CompTek ανέπτυξε το Yandex, ένα πρόγραμμα αναζήτησης σκληρού δίσκου. Το 1996, προστέθηκε στο πρόγραμμα η δυνατότητα αναζήτησης στο Web. Το 1997 γράφτηκε το πρώτο ρομπότ αναζήτησης, ευρετηριάστηκε το Runet και 23 Σεπτεμβρίου 1997έτος, πραγματοποιήθηκε η επίσημη παρουσίαση του Yandex.

Το Yandex της CompTek δεν είναι το παλαιότερο, αλλά οι τεχνολογίες αναζήτησης και η έρευνά τους στη γλωσσολογία και τη μορφολογία είναι οι παλαιότερες στη Ρωσία.

Η δημοτικότητα των μηχανών αναζήτησης στη Ρωσία, την Ουκρανία και τον κόσμο. Η ιστορία της ανάπτυξης των μηχανών αναζήτησης. Ο Rambler και ο Aport είναι εξαφανισμένοι δεινόσαυροι.
Πάντα υποστήριζα και θα συνεχίσω να υποστηρίζω ότι ένας στενός ειδικός που δεν ενδιαφέρεται για τίποτα παρά μόνο για καθαρά πρακτικές λεπτομέρειες δεν θα μπορέσει να πετύχει πραγματικά ύψη στο επάγγελμά του. Ένα τέτοιο άτομο δεν γίνεται "στενό", αλλά "στενόμυαλο" :-) Επομένως, ας δούμε την ιστορία της ανάπτυξης των μηχανών αναζήτησης, καθώς και το μερίδιο αγοράς που κατέχει αυτή τη στιγμή κάθε μία από τις μηχανές αναζήτησης. Η δημοτικότητα των μηχανών αναζήτησης στη Ρωσία και την Ουκρανία είναι μια πολύ σημαντική στιγμή για προώθηση.

Ιστορία των μηχανών αναζήτησης . Στη μακρινή δεκαετία του '90, όταν το Διαδίκτυο μόλις άρχιζε να έρχεται στη ζωή, οι μηχανές αναζήτησης με τη σύγχρονη έννοια της λέξης δεν υπήρχαν. Η αναζήτηση για τον απαιτούμενο πόρο πραγματοποιήθηκε μέσω καταλόγων τοποθεσιών, όπου τα έργα Διαδικτύου που ήταν διαθέσιμα εκείνη την εποχή ταξινομήθηκαν ανά επικεφαλίδες. Δεδομένου ότι υπήρχαν λίγοι χρήστες στο δίκτυο και γενικά υπήρχαν λίγοι ιστότοποι, αυτός ο τρόπος δόμησης δεδομένων ήταν αρκετά βολικός και επαρκής.

Η πρώτη πλήρης μηχανή αναζήτησης ήταν το έργο WebCrawler. Η θεμελιώδης διαφορά από τους προκατόχους της ήταν ότι αυτή η μηχανή αναζήτησης πραγματοποίησε το λεγόμενο. αναζήτηση πλήρους κειμένου. Εκείνοι. έκανε αναζήτηση όχι μόνο τοπικά σε κάποιον κατάλογο, όχι μόνο στη μετα-ετικέτα Λέξεις-κλειδιά, αλλά ανέλυσε το πλήρες κείμενο της ιστοσελίδας, γεγονός που επέτρεψε την επιτυχή εύρεση οποιωνδήποτε φράσεων (και όχι μόνο εκείνων που ο webmaster υπέδειξε ως λέξεις-κλειδιά στην περιγραφή του ο ιστότοπός του).

Προσωπικά, το όνομα WebCrawler δεν σημαίνει τίποτα για μένα - είναι πολύ μακριά στο παρελθόν, στη Ρωσία εκείνη την εποχή δεν άκουγαν όλοι τη λέξη Internet :-) Αλλά το Lycos, που εμφανίστηκε το 1996, είναι ήδη στα χείλη παλαιότερων webmasters , σε κάθε περίπτωση, αυτά τα πολλά είναι γνωστά. Λίγο μετά το Lycos, κυκλοφόρησε η καλύτερη μηχανή αναζήτησης της εποχής της, η AltaVista - πρέπει να έχετε ακούσει αυτό το όνομα. Μέχρι περίπου το 2000, η AltaVista παρέμεινε η κορυφαία μηχανή αναζήτησης στον κόσμο.

Το 1998 ιδρύθηκε η Google. Οι προγραμματιστές της, Sergey Brin και Larry Page, έφεραν επανάσταση στην ποιότητα της αναζήτησης αναπτύσσοντας τον αλγόριθμο PageRank, ο οποίος σας επιτρέπει να λαμβάνετε υπόψη το «βάρος» μιας σελίδας, ανάλογα με τον αριθμό των συνδέσμων προς αυτήν. Αυτό βελτίωσε την ποιότητα της αναζήτησης τόσο ριζικά που η Google άρχισε να κερδίζει γρήγορα κοινό και μέσα σε λίγα χρόνια έγινε η κορυφαία μηχανή αναζήτησης στον κόσμο, η οποία παραμένει μέχρι σήμερα. Θυμάμαι, το 2000 περίπου, παρακολούθησα μια διαμάχη μεταξύ δύο φοιτητών στην ομάδα μας στο ινστιτούτο που το Altavista είναι χάλια και το Google αναζητά καλύτερα :-)

Aport μηχανή αναζήτησης . Η ανάπτυξη του Agama, που κυκλοφόρησε το 1996. Ένα έργο που για αρκετά χρόνια παρέμεινε η κορυφαία μηχανή αναζήτησης στο Runet. Το γράφω αυτό και αρχίζω να νιώθω πολύ αρχαίος ο ίδιος :-) Άλλωστε, κάποτε, ως φοιτητές, ήταν το Aport που ψάχναμε. Δεν υπήρχαν άλλες εναλλακτικές και δεν χρειάζονταν, γιατί το Aport έκανε τέλεια τη δουλειά του.

Ένα εξαιρετικό ξεκίνημα, ωστόσο, δεν πρόσφερε εξίσου εξαιρετική εξέλιξη στο μέλλον. Το λιμάνι ήταν τόσο νόστιμο μεζέ που άλλαζε ιδιοκτήτες αρκετές φορές, κάθε φορά που πουλούσε όλο και περισσότερο. Αυτό, προφανώς, ήταν που τον σκότωσε. Η «αποτελεσματική διαχείριση και μάρκετινγκ» ήρθε στο προσκήνιο και η τεχνική υποστήριξη «σημειώθηκε». Μετά από αυτό, οι χρήστες του Runet γύρισαν την πλάτη τους στο Aport - ευτυχώς, οι άλλες δύο κύριες μηχανές αναζήτησης - η Rambler και η Yandex - αγωνίζονταν ενεργά για μια θέση στον ήλιο.

Δεν θυμάμαι τις ακριβείς ημερομηνίες, αλλά στην αρχή το Aport εγκατέλειψε τους δικούς του αλγόριθμους κατάταξης, άρχισε να χρησιμοποιεί δεδομένα Yandex και πριν από μερικά χρόνια έπαψε να υπάρχει εντελώς ως μηχανή αναζήτησης. Τώρα ένα ηλεκτρονικό κατάστημα βρίσκεται στο διάσημο domain, και όχι της καλύτερης ποιότητας.

Ε... αλλά κάποτε το Aport είχε επίσης τον δικό του κατάλογο, στον οποίο οι webmasters προσπάθησαν να μπουν σχεδόν με την ίδια δύναμη όπως τώρα στο Yandex. Παρεμπιπτόντως, το πρώτο σχέδιο για το Aport αναπτύχθηκε από τον Artemy Lebedev… σχεδόν ταυτόχρονα με το σχέδιο για το Yandex.

Μηχανή αναζήτησης Rambler . Το Rambler κυκλοφόρησε το ίδιο το 1996 και παρέμεινε ένας από τους κύριους παίκτες στην αγορά για σχεδόν μια δεκαετία. Σε αντίθεση με τον Άπορτ, που «έσβηνε» πολύ, πολύ γρήγορα, ο Ράμπλερ κατέβηκε στην τρέχουσα «θέση αστέγου» αργά και με αντίσταση.

Σχεδόν μέχρι την τελευταία στιγμή, η Rambler συνέχισε να εργάζεται με τη δική της μηχανή αναζήτησης, η οποία, παρεμπιπτόντως, έδωσε καλή ποιότητα. Σκεφτείτε μόνο - για πολλά χρόνια το Rambler ήταν η δεύτερη μηχανή αναζήτησης Runet και η τρίτη δεν ήταν το ήδη μισοπεθαμένο Aport, αλλά η πανίσχυρη Google!

Ωστόσο, το μερίδιο αγοράς της Rambler συρρικνώθηκε και συρρικνώθηκε και το 2011 εξαγοράστηκε από τη Yandex και άρχισε να παράγει αποτελέσματα πανομοιότυπα με την Yandex. Έτσι τελείωσε η ιστορία του Rambler, κάποτε η ισχυρότερη ρωσική μηχανή αναζήτησης.

Μηχανές αναζήτησης Google και Yandex . Προς το παρόν, στην πραγματικότητα, υπάρχουν μόνο δύο σχετικές μηχανές αναζήτησης - η Yandex και η Google. Όλα τα είδη Lucos και Altavista έχουν ξεχαστεί εδώ και καιρό και δεν λειτουργούν ως υπηρεσίες αναζήτησης. Το Rambler αγοράστηκε από την Yandex και τώρα δείχνει τα αποτελέσματα της τελευταίας. Το Aport έχει μετατραπεί σε ηλεκτρονικό κατάστημα. Ένα πολύ μικρό μερίδιο της αγοράς κατέχουν οι Yahoo και Bing - αναζήτηση από τη Microsoft. Στη Ρωσία, εκτός από το Yandex και το Google, υπάρχει και το Mail.ru, αλλά δεν έχει τη δική του μηχανή αναζήτησης, αλλά χρησιμοποιεί αποτελέσματα αναζήτησης από την Google, κάνοντας μόνο μικρές προσαρμογές σε αυτά.

Η δημοτικότητα των μηχανών αναζήτησης στη Ρωσία, την Ουκρανία και στον κόσμο . Προς το παρόν, η αγορά αναζήτησης στη Ρωσία χωρίζεται περίπου ως εξής:

Yandex - 63%
Google - 26%
Mail.ru - 8%
Rambler - 1,5%
Bing - 0,6%

Στην Ουκρανία, η αναλογία είναι σημαντικά διαφορετική, η Yandex βρίσκεται πολύ πίσω από τον κύριο ανταγωνιστή της, αλλά αυξάνει αργά το μερίδιο αγοράς της:

Google - 60%
Yandex - 29%
Mail.ru - 6%

Στην παγκόσμια αναζήτηση, υπάρχει μόνο ένας ηγέτης, απόλυτος και άνευ όρων - η Google.

Παρεμπιπτόντως, εσείς και εγώ μπορούμε να νιώσουμε μια άξια περηφάνιας στη χώρα μας - μόνο στη Ρωσία και την Κίνα έχουν δημιουργηθεί τα δικά τους συστήματα αναζήτησης. Πουθενά αλλού στον κόσμο δεν εμφανίστηκαν μηχανές αναζήτησης υψηλής ποιότητας. Σε ευρωπαϊκές χώρες - Γαλλία, Γερμανία και άλλες - η Google χρησιμοποιείται από έως και 97-99% των χρηστών, π.χ. ουσιαστικά δεν υπάρχει εναλλακτική.

Υπάρχει επίσης μια πρακτική πτυχή σε αυτό - ένας Ρώσος webmaster είναι πιο πιθανό να προσελκύσει επισκέπτες από την αναζήτηση. Συχνά συμβαίνει ότι η Yandex «αγαπά» τον ιστότοπο, αλλά η Google όχι, ή το αντίστροφο. Αλλά και στις δύο περιπτώσεις, ο ιστότοπος έχει πελάτες. Οι δυτικοί συνάδελφοί μας εργάζονται με βάση την αρχή «όλα ή τίποτα».

Υπάρχει ένα δεύτερο σημείο - η προώθηση στο Google και το Yandex διαφέρει σε κάποιο βαθμό και η επιθυμία να μπείτε στην κορυφή και των δύο ηγετών αφήνει το σημάδι της στο μοντέλο προώθησης ιστότοπου.

Το βιβλίο μου εκδίδεται σε έντυπη μορφή.Εάν αυτό το εγχειρίδιο αποδείχθηκε χρήσιμο για εσάς, τότε μπορείτε να με ευχαριστήσετε όχι μόνο ηθικά, αλλά και αρκετά απτά.
Για αυτό πρέπει να πάτε στο

Η αρχιτεκτονική μιας μηχανής αναζήτησης περιλαμβάνει συνήθως:

Εγκυκλοπαιδικό YouTube

1 / 5

✪ Μάθημα 3: Πώς λειτουργεί μια μηχανή αναζήτησης. Εισαγωγή στο SEO

✪ Μηχανή αναζήτησης από μέσα

✪ Shodan - Black Google

✪ Η μηχανή αναζήτησης Cheburashka θα αντικαταστήσει το Google και το Yandex στη Ρωσία

✪ Μάθημα 1 - Πώς λειτουργεί μια μηχανή αναζήτησης

Υπότιτλοι

Ιστορία

ιστορική αναδρομή
Ετος	Σύστημα	Εκδήλωση
1993	W3Catalog?!	εκτόξευση
	Aliweb	εκτόξευση
	JumpStation	εκτόξευση
1994	πρόγραμμα ανίχνευσης ιστού	εκτόξευση
	infoseek	εκτόξευση
	Λύκος	εκτόξευση
1995	AltaVista	εκτόξευση
	Daum	Βάση
	ανοιχτό κείμενοευρετήριο ιστού	εκτόξευση
	Μαγγελάνος	εκτόξευση
	Διεγείρω	εκτόξευση
	SAPO	εκτόξευση
	Yahoo!	εκτόξευση
1996	Σκυλόσωμος	εκτόξευση
	Inktomi	Βάση
	Περιπλανώμενος υποκείμενο	Βάση
	hotbot	Βάση
	Ρωτήστε τον Jeeves	Βάση
1997	Βόρειο σέλας	εκτόξευση
1997	Yandex	εκτόξευση
1998	Google	εκτόξευση
1999	AlltheWeb	εκτόξευση
	GenieKnows	Βάση
	Naver	εκτόξευση
	Teoma	Βάση
	Vivisimo	Βάση
2000	Baidu	Βάση
2000	Exalead	Βάση
2003	info.com	εκτόξευση
2004	Yahoo! Αναζήτηση	Τελική εκτόξευση
	A9.com	εκτόξευση
	σόγου	εκτόξευση
2005	MSN Αναζήτηση	Τελική εκτόξευση
	Ask.com	εκτόξευση
	Nigma	εκτόξευση
	αναζήτηση αγαθών	εκτόξευση
Ψάξε με	Βάση
2006	wikiseek	Βάση
	Quaero	Βάση
	Ζωντανή αναζήτηση	εκτόξευση
	ChaCha	Εκκίνηση (beta)
	Guruji.com	Εκκίνηση (beta)
2007	wikiseek	εκτόξευση
	Sproose	εκτόξευση
	Wikia Αναζήτηση	εκτόξευση
	blackle.com	εκτόξευση
2008	DuckDuckGo	εκτόξευση
	Tooby	εκτόξευση
	Picollator	εκτόξευση
	Viewzi	εκτόξευση
	Cuil	εκτόξευση
	Boogami	εκτόξευση
	LeapFish	Εκκίνηση (beta)
	Forestle	εκτόξευση
	VADLO	εκτόξευση
	powerset	εκτόξευση
2009	bing	εκτόξευση
	KAZ.KZ	εκτόξευση
	Yebol	Εκκίνηση (beta)
	Μουγκούρντι	κλείσιμο
	Ανιχνευτής	εκτόξευση
2010	Cuil	κλείσιμο
	Blekko	Εκκίνηση (beta)
	Viewzi	κλείσιμο
2012	WAZZUB	εκτόξευση
2014	Δορυφόρος	Εκκίνηση (beta)

Σε πρώιμο στάδιο της ανάπτυξης του Διαδικτύου, ο Tim Berners-Lee διατήρησε μια λίστα με διακομιστές ιστού που δημοσιεύτηκε στον ιστότοπο του CERN. Υπήρχαν όλο και περισσότεροι ιστότοποι και η χειροκίνητη διατήρηση μιας τέτοιας λίστας γινόταν όλο και πιο δύσκολη. Ο ιστότοπος του NCSA είχε μια ειδική ενότητα "Τι νέο υπάρχει!". (eng. What's New!), όπου δημοσίευσαν συνδέσμους προς νέους ιστότοπους.

Το πρώτο πρόγραμμα υπολογιστή για αναζήτηση στο Διαδίκτυο ήταν Άρτσι(Αγγλικά archie - αρχείο χωρίς το γράμμα "c"). Δημιουργήθηκε το 1990 από τους Alan Emtage, Bill Heelan και J. Peter Deutsch, φοιτητές πληροφορικής στο Πανεπιστήμιο McGill στο Μόντρεαλ. Το πρόγραμμα κατέβασε λίστες με όλα τα αρχεία από όλους τους διαθέσιμους ανώνυμους διακομιστές FTP και δημιούργησε μια βάση δεδομένων που μπορούσε να αναζητηθεί με ονόματα αρχείων. Ωστόσο, το πρόγραμμα του Archie δεν ευρετηρίασε τα περιεχόμενα αυτών των αρχείων, καθώς ο όγκος των δεδομένων ήταν τόσο μικρός που όλα μπορούσαν να βρεθούν εύκολα με το χέρι.

Η ανάπτυξη και η διάδοση του πρωτοκόλλου δικτύου Gopher, που επινοήθηκε το 1991 από τον Mark McCahill στο Πανεπιστήμιο της Μινεσότα, οδήγησε στη δημιουργία δύο νέων προγραμμάτων αναζήτησης, Βερενίκηκαι Jughead. Όπως και ο Archie, αναζήτησαν ονόματα αρχείων και κεφαλίδες που ήταν αποθηκευμένες στα συστήματα ευρετηρίου του Gopher. Βερόνικα (Αγγλικά) Πολύ εύκολο ευρετήριο προσανατολισμένο στα τρωκτικά σε ηλεκτρονικά αρχεία) επιτρέπονται οι αναζητήσεις λέξεων-κλειδιών για τις περισσότερες επικεφαλίδες του μενού Gopher σε όλες τις λίστες Gopher. Το πρόγραμμα Jughead Jonzy's Universal Gopher Hierarchy Excavation and Display) ανακτήθηκαν πληροφορίες μενού από ορισμένους διακομιστές Gopher. Αν και το όνομα της μηχανής αναζήτησης του Archie δεν είχε σχέση με τη σειρά κόμικ "Archie", παρόλα αυτά η Veronica και ο Jughead είναι χαρακτήρες σε αυτά τα κόμικ.

Μέχρι το καλοκαίρι του 1993, δεν υπήρχε ακόμη ένα ενιαίο σύστημα αναζήτησης στον Ιστό, αν και πολλοί εξειδικευμένοι κατάλογοι διατηρούνταν χειροκίνητα. Ο Oscar Nierstrasz στο Πανεπιστήμιο της Γενεύης έγραψε μια σειρά από σενάρια Perl που αντέγραφαν περιοδικά αυτές τις σελίδες και τις ξαναέγραφαν σε τυπική μορφή. Αυτό έγινε η βάση για W3Catalog?!, η πρώτη πρωτόγονη μηχανή αναζήτησης Ιστού, που κυκλοφόρησε στις 2 Σεπτεμβρίου 1993.

Πιθανώς η πρώτη μηχανή αναζήτησης που γράφτηκε σε Perl ήταν το "World Wide Web Wanderer", ένα ρομπότ του Matthew Gray από τον Ιούνιο του 1993. Αυτό το ρομπότ δημιούργησε το ευρετήριο αναζήτησης "Wandex". Ο σκοπός του ρομπότ Wanderer ήταν να μετρήσει το μέγεθος του Παγκόσμιου Ιστού και να βρει όλες τις ιστοσελίδες που περιέχουν τις λέξεις από το ερώτημα. Το 1993, εμφανίστηκε η δεύτερη μηχανή αναζήτησης Aliweb. Το Aliweb δεν χρησιμοποίησε πρόγραμμα ανίχνευσης, αλλά περίμενε ειδοποιήσεις από τους διαχειριστές ιστότοπων σχετικά με την παρουσία ενός αρχείου ευρετηρίου σε μια συγκεκριμένη μορφή στους ιστότοπούς τους.

JumpStation, που δημιουργήθηκε τον Δεκέμβριο του 1993 από τον Jonathan Fletcher, έκανε αναζήτηση και ευρετηρίαση ιστοσελίδων χρησιμοποιώντας έναν ανιχνευτή και χρησιμοποίησε μια φόρμα Ιστού ως διεπαφή για τη διαμόρφωση ερωτημάτων αναζήτησης. Ήταν το πρώτο εργαλείο αναζήτησης στο Διαδίκτυο που συνδύαζε τις τρεις βασικές λειτουργίες μιας μηχανής αναζήτησης (επαλήθευση, ευρετηρίαση και πραγματική αναζήτηση). Λόγω των περιορισμένων υπολογιστικών πόρων της εποχής, η δημιουργία ευρετηρίου και επομένως η αναζήτηση περιοριζόταν μόνο στους τίτλους και τους τίτλους των ιστοσελίδων που βρήκε ο ανιχνευτής.

Οι μηχανές αναζήτησης συμμετείχαν στο Dot-com Bubble στα τέλη της δεκαετίας του 1990. Αρκετές εταιρείες εισήλθαν στην αγορά με θεαματικό τρόπο, δημιουργώντας κέρδη ρεκόρ κατά τις IPO τους. Κάποιοι έχουν εγκαταλείψει τη δημόσια αγορά μηχανών αναζήτησης και συνεργάζονται μόνο με τον εταιρικό τομέα, όπως π.χ Βόρειο σέλας.

Η Google ανέλαβε την ιδέα της πώλησης λέξεων-κλειδιών το 1998, όταν ήταν μια μικρή εταιρεία που έτρεχε μια μηχανή αναζήτησης στο goto.com. Η κίνηση σηματοδότησε μια στροφή για τις μηχανές αναζήτησης από τον ανταγωνισμό μεταξύ τους σε ένα από τα πιο κερδοφόρα επιχειρηματικά εγχειρήματα στο Διαδίκτυο. Οι μηχανές αναζήτησης άρχισαν να πωλούν τις πρώτες θέσεις στα αποτελέσματα αναζήτησης σε μεμονωμένες εταιρείες.

Η μηχανή αναζήτησης Google βρίσκεται σε περίοπτη θέση από τις αρχές της δεκαετίας του 2000. Η εταιρεία έχει κατακτήσει υψηλή θέση λόγω των καλών αποτελεσμάτων αναζήτησης χρησιμοποιώντας τον αλγόριθμο PageRank. Ο αλγόριθμος παρουσιάστηκε στο κοινό στο άρθρο «The Anatomy of Search Engine» που έγραψαν οι Sergey Brin και Larry Page, ιδρυτές της Google. Αυτός ο επαναληπτικός αλγόριθμος ταξινομεί τις ιστοσελίδες με βάση μια εκτίμηση του αριθμού των υπερσυνδέσμων σε μια ιστοσελίδα, υποθέτοντας ότι οι "καλές" και οι "σημαντικές" σελίδες λαμβάνουν περισσότερους συνδέσμους από άλλες. Η διεπαφή της Google έχει σχεδιαστεί σε ένα σπαρταριστό στυλ, όπου δεν υπάρχει τίποτα περιττό, σε αντίθεση με πολλούς από τους ανταγωνιστές της που δημιούργησαν τη μηχανή αναζήτησης στη διαδικτυακή πύλη. Η μηχανή αναζήτησης Google έχει γίνει τόσο δημοφιλής που έχουν εμφανιστεί μιμητές της, για παράδειγμα, Αναζητητής μυστηρίου(μυστική μηχανή αναζήτησης).

Αναζήτηση πληροφοριών στα ρωσικά

Το 1996, πραγματοποιήθηκε αναζήτηση λαμβάνοντας υπόψη τη ρωσική μορφολογία στη μηχανή αναζήτησης Altavista και κυκλοφόρησαν οι αρχικές ρωσικές μηχανές αναζήτησης Rambler και Aport. Στις 23 Σεπτεμβρίου 1997 άνοιξε η μηχανή αναζήτησης Yandex. Στις 22 Μαΐου 2014, άνοιξε η εθνική μηχανή αναζήτησης Sputnik από τη Rostelecom, η οποία την εποχή του 2015 βρίσκεται σε beta testing. Στις 22 Απριλίου 2015 κυκλοφόρησε μια νέα υπηρεσία Sputnik. Παιδιά ειδικά για παιδιά με αυξημένη ασφάλεια.

Οι μέθοδοι ανάλυσης συστάδων και αναζήτησης μεταδεδομένων έχουν κερδίσει μεγάλη δημοτικότητα. Από τις διεθνείς μηχανές αυτού του είδους, το πιο διάσημο ήταν "Απλός"εταιρείες Vivisimo. Το 2005, με την υποστήριξη του Κρατικού Πανεπιστημίου της Μόσχας, ξεκίνησε στη Ρωσία η μηχανή αναζήτησης Nigma, η οποία υποστηρίζει την αυτόματη ομαδοποίηση. Το 2006, άνοιξε η ρωσική μεταμηχανή Quintura, η οποία προσφέρει οπτική ομαδοποίηση με τη μορφή ενός σύννεφου ετικετών. Η Nigma πειραματίστηκε επίσης με οπτική ομαδοποίηση.

Πώς λειτουργεί η μηχανή αναζήτησης

Τα κύρια στοιχεία μιας μηχανής αναζήτησης: ρομπότ αναζήτησης, ευρετήριο, μηχανή αναζήτησης.

Κατά κανόνα, τα συστήματα λειτουργούν σταδιακά. Πρώτα, ο ανιχνευτής λαμβάνει το περιεχόμενο, στη συνέχεια ο ευρετηριαστής δημιουργεί ένα ευρετήριο με δυνατότητα αναζήτησης και, τέλος, ο ανιχνευτής παρέχει τη λειτουργία αναζήτησης στα ευρετηριασμένα δεδομένα. Για την ενημέρωση της μηχανής αναζήτησης, αυτός ο κύκλος ευρετηρίου επαναλαμβάνεται.

Οι μηχανές αναζήτησης λειτουργούν αποθηκεύοντας πληροφορίες για πολλές ιστοσελίδες που λαμβάνουν από σελίδες HTML. Ρομπότ αναζήτησης ή "ανιχνευτής" (eng. Crawler) - ένα πρόγραμμα που ακολουθεί αυτόματα όλους τους συνδέσμους που βρίσκονται στη σελίδα και τους επισημαίνει. Ο ανιχνευτής, με βάση συνδέσμους ή με βάση μια προκαθορισμένη λίστα διευθύνσεων, αναζητά νέα έγγραφα που δεν είναι ακόμη γνωστά στη μηχανή αναζήτησης. Ο κάτοχος του ιστότοπου μπορεί να εξαιρέσει ορισμένες σελίδες χρησιμοποιώντας το robots.txt , το οποίο μπορεί να χρησιμοποιηθεί για να αποτρέψει την ευρετηρίαση αρχείων, σελίδων ή καταλόγων του ιστότοπου.

Η μηχανή αναζήτησης αναλύει το περιεχόμενο κάθε σελίδας για περαιτέρω ευρετηρίαση. Οι λέξεις μπορούν να εξαχθούν από τίτλους, κείμενο σελίδας ή ειδικά πεδία - μετα-ετικέτες. Ο δείκτης είναι μια ενότητα που αναλύει μια σελίδα, αφού τη χωρίσει σε μέρη, χρησιμοποιώντας τους δικούς της λεξιλογικούς και μορφολογικούς αλγόριθμους. Όλα τα στοιχεία μιας ιστοσελίδας απομονώνονται και αναλύονται ξεχωριστά. Τα δεδομένα ιστοσελίδας αποθηκεύονται σε μια βάση δεδομένων ευρετηρίου για χρήση σε επόμενα αιτήματα. Το ευρετήριο σάς επιτρέπει να βρίσκετε γρήγορα πληροφορίες σχετικά με το αίτημα του χρήστη. Ορισμένες μηχανές αναζήτησης, όπως η Google, αποθηκεύουν ολόκληρη ή μέρος της αρχικής σελίδας, τη λεγόμενη κρυφή μνήμη, καθώς και διάφορες πληροφορίες σχετικά με την ιστοσελίδα. Άλλα συστήματα, όπως το AltaVista, αποθηκεύουν κάθε λέξη κάθε σελίδας που βρίσκεται. Η χρήση της προσωρινής μνήμης βοηθά στην επιτάχυνση της εξαγωγής πληροφοριών από σελίδες που έχετε ήδη επισκεφτεί. Οι αποθηκευμένες σελίδες περιέχουν πάντα το κείμενο που καθόρισε ο χρήστης στο ερώτημα αναζήτησης. Αυτό μπορεί να είναι χρήσιμο όταν η ιστοσελίδα έχει ενημερωθεί, δηλαδή δεν περιέχει πλέον το κείμενο του αιτήματος του χρήστη και η σελίδα στην κρυφή μνήμη είναι ακόμα παλιά. Αυτή η κατάσταση σχετίζεται με την απώλεια συνδέσμων (Eng. linkrot) και η φιλική προς τον χρήστη (χρηστικότητα) προσέγγιση της Google. Αυτό περιλαμβάνει την έκδοση σύντομων τμημάτων κειμένου από τη μνήμη cache που περιέχει το κείμενο του ερωτήματος. Ισχύει η αρχή της ελάχιστης έκπληξης, ο χρήστης συνήθως αναμένει να δει τις λέξεις αναζήτησης στα κείμενα των σελίδων που έλαβε ( προσδοκίες των χρηστών). Εκτός από την επιτάχυνση των αναζητήσεων με χρήση αποθηκευμένων σελίδων, οι αποθηκευμένες σελίδες ενδέχεται να περιέχουν πληροφορίες που δεν είναι πλέον διαθέσιμες αλλού.

Η μηχανή αναζήτησης λειτουργεί με αρχεία εξόδου που λαμβάνονται από το ευρετήριο. Η μηχανή αναζήτησης δέχεται αιτήματα χρηστών, τα επεξεργάζεται χρησιμοποιώντας ένα ευρετήριο και επιστρέφει αποτελέσματα αναζήτησης.

Όταν ένας χρήστης εισάγει ένα ερώτημα σε μια μηχανή αναζήτησης (συνήθως χρησιμοποιώντας λέξεις-κλειδιά), το σύστημα ελέγχει το ευρετήριό του και επιστρέφει μια λίστα με τις πιο σχετικές ιστοσελίδες (ταξινομημένες βάσει κάποιου κριτηρίου), συνήθως με έναν σύντομο σχολιασμό που περιέχει τον τίτλο του εγγράφου και μερικές φορές μέρη του κειμένου. Το ευρετήριο αναζήτησης είναι κατασκευασμένο σύμφωνα με μια ειδική τεχνική που βασίζεται σε πληροφορίες που εξάγονται από ιστοσελίδες. Από το 2007, η μηχανή αναζήτησης Google σάς επιτρέπει να κάνετε αναζήτηση βάσει χρόνου, να δημιουργείτε τα έγγραφα που αναζητάτε (καλέστε το μενού "Εργαλεία αναζήτησης" και καθορίστε το χρονικό εύρος). Οι περισσότερες μηχανές αναζήτησης υποστηρίζουν τη χρήση τελεστών δυαδικού AND, OR, NOT σε ερωτήματα, γεγονός που σας επιτρέπει να κάνετε πιο συγκεκριμένη ή να επεκτείνετε τη λίστα των λέξεων-κλειδιών που αναζητήσατε. Σε αυτήν την περίπτωση, το σύστημα θα αναζητήσει λέξεις ή φράσεις ακριβώς όπως έχουν εισαχθεί. Ορισμένες μηχανές αναζήτησης το επιτρέπουν κατά προσέγγιση αναζήτηση, σε αυτήν την περίπτωση, οι χρήστες επεκτείνουν την περιοχή αναζήτησης καθορίζοντας την απόσταση από τις λέξεις-κλειδιά . Υπάρχουν επίσης εννοιολογική αναζήτηση, το οποίο χρησιμοποιεί μια στατιστική ανάλυση της χρήσης των λέξεων και φράσεων αναζήτησης στα κείμενα των ιστοσελίδων. Αυτά τα συστήματα σάς επιτρέπουν να συντάσσετε ερωτήματα σε φυσική γλώσσα. Ένα παράδειγμα τέτοιας μηχανής αναζήτησης είναι ο ιστότοπος ask com.

Η χρησιμότητα μιας μηχανής αναζήτησης εξαρτάται από τη συνάφεια των σελίδων που βρίσκει. Ενώ εκατομμύρια ιστοσελίδες μπορεί να περιλαμβάνουν μια λέξη ή φράση, ορισμένες μπορεί να είναι πιο σχετικές, δημοφιλείς ή έγκυρες από άλλες. Οι περισσότερες μηχανές αναζήτησης χρησιμοποιούν μεθόδους κατάταξης για να φέρουν τα «καλύτερα» αποτελέσματα στην κορυφή της λίστας. Οι μηχανές αναζήτησης αποφασίζουν ποιες σελίδες είναι πιο σχετικές και με ποια σειρά θα πρέπει να εμφανίζονται τα αποτελέσματα με διαφορετικούς τρόπους. Οι μέθοδοι αναζήτησης, όπως το ίδιο το Διαδίκτυο, αλλάζουν με την πάροδο του χρόνου. Έτσι, εμφανίστηκαν δύο κύριοι τύποι μηχανών αναζήτησης: συστήματα προκαθορισμένων και ιεραρχικά διατεταγμένων λέξεων-κλειδιών και συστήματα στα οποία δημιουργείται ένα ανεστραμμένο ευρετήριο με βάση την ανάλυση κειμένου.

Οι περισσότερες μηχανές αναζήτησης είναι εμπορικές επιχειρήσεις που αποκομίζουν κέρδη από τη διαφήμιση, σε ορισμένες μηχανές αναζήτησης μπορείτε να αγοράσετε κορυφαίες θέσεις στα αποτελέσματα αναζήτησης για συγκεκριμένες λέξεις-κλειδιά έναντι αμοιβής. Όσες μηχανές αναζήτησης δεν παίρνουν χρήματα για τη σειρά των αποτελεσμάτων, κερδίζουν από τη διαφήμιση με βάση τα συμφραζόμενα, ενώ τα διαφημιστικά μηνύματα αντιστοιχούν στο αίτημα του χρήστη. Τέτοιες διαφημίσεις εμφανίζονται στη σελίδα με μια λίστα αποτελεσμάτων αναζήτησης και οι μηχανές αναζήτησης κερδίζουν κάθε φορά που ένας χρήστης κάνει κλικ σε διαφημιστικά μηνύματα.

Τύποι μηχανών αναζήτησης

Υπάρχουν τέσσερις τύποι μηχανών αναζήτησης: ρομποτικές, ανθρωποκεντρικές, υβριδικές και μετασυστήματα.

συστήματα που χρησιμοποιούν ρομπότ αναζήτησης

Αποτελούνται από τρία μέρη: ένα πρόγραμμα ανίχνευσης ("bot", "ρομπότ" ή "αράχνη"), ένα ευρετήριο και ένα λογισμικό μηχανής αναζήτησης. Ο ανιχνευτής χρειάζεται για να παρακάμψει το δίκτυο και να δημιουργήσει λίστες ιστοσελίδων. Ένα ευρετήριο είναι ένα μεγάλο αρχείο αντιγράφων ιστοσελίδων. Ο σκοπός του λογισμικού είναι η αξιολόγηση των αποτελεσμάτων αναζήτησης. Λόγω του γεγονότος ότι ο ανιχνευτής σε αυτόν τον μηχανισμό εξερευνά συνεχώς το δίκτυο, οι πληροφορίες είναι πιο ενημερωμένες. Οι περισσότερες σύγχρονες μηχανές αναζήτησης είναι συστήματα αυτού του τύπου.

συστήματα ελεγχόμενα από τον άνθρωπο (κατάλογοι πόρων)

Αυτές οι μηχανές αναζήτησης λαμβάνουν λίστες ιστοσελίδων. Ο κατάλογος περιέχει τη διεύθυνση, τον τίτλο και μια σύντομη περιγραφή του ιστότοπου. Ο κατάλογος πόρων αναζητά αποτελέσματα μόνο από περιγραφές σελίδων που υποβάλλονται σε αυτόν από webmasters. Το πλεονέκτημα των καταλόγων είναι ότι όλοι οι πόροι ελέγχονται χειροκίνητα, επομένως, η ποιότητα του περιεχομένου θα είναι καλύτερη σε σύγκριση με τα αποτελέσματα που λαμβάνονται αυτόματα από το σύστημα του πρώτου τύπου. Υπάρχει όμως και ένα μειονέκτημα - η ενημέρωση αυτών των καταλόγων γίνεται χειροκίνητα και μπορεί να υστερεί σημαντικά σε σχέση με την πραγματική κατάσταση πραγμάτων. Οι κατατάξεις σελίδων δεν μπορούν να αλλάξουν αμέσως. Παραδείγματα τέτοιων συστημάτων είναι Κατάλογος Yahoo, dmoz και Galaxy.

υβριδικά συστήματα

Οι μηχανές αναζήτησης όπως το Yahoo, το Google, το MSN συνδυάζουν τις λειτουργίες συστημάτων που χρησιμοποιούν ρομπότ αναζήτησης και συστήματα ελεγχόμενα από τον άνθρωπο.

μετασυστήματα

Οι μηχανές μετα-αναζήτησης συνδυάζουν και ταξινομούν τα αποτελέσματα πολλών μηχανών αναζήτησης ταυτόχρονα. Αυτές οι μηχανές αναζήτησης ήταν χρήσιμες όταν κάθε μηχανή αναζήτησης είχε ένα μοναδικό ευρετήριο και οι μηχανές αναζήτησης ήταν λιγότερο «έξυπνες». Δεδομένου ότι η αναζήτηση έχει βελτιωθεί τόσο πολύ τώρα, η ανάγκη για αυτά έχει μειωθεί. Παραδείγματα: MetaCrawlerκαι MSN Search.

Αγορά μηχανών αναζήτησης

Η Google είναι η πιο δημοφιλής μηχανή αναζήτησης στον κόσμο με μερίδιο αγοράς 68,69%. Η Bing καταλαμβάνει τη δεύτερη θέση, το μερίδιό της είναι 12,26%.

Οι πιο δημοφιλείς μηχανές αναζήτησης στον κόσμο:

Σύστημα αναζήτησης	Μερίδιο αγοράς τον Ιούλιο του 2014	Μερίδιο αγοράς τον Οκτώβριο του 2014	Μερίδιο αγοράς τον Σεπτέμβριο του 2015
Google	68,69 %	58,01 %	69,24%
Baidu	17,17 %	29,06 %	6,48%
bing	6,22 %	8,01 %	12,26%
Yahoo!	6,74 %	4,01 %	9,19%
AOL	0,13 %	0,21 %	1,11%
Διεγείρω	0,22 %	0,00 %	0,00 %
Παρακαλώ	0,13 %	0,10 %	0,24%

Ασία

Στις χώρες της Ανατολικής Ασίας και στη Ρωσία, η Google δεν είναι η πιο δημοφιλής μηχανή αναζήτησης. Στην Κίνα, για παράδειγμα, πιο δημοφιλής μηχανή αναζήτησης Soso?!.

Στη Νότια Κορέα, η αποκλειστική πύλη αναζήτησης της Naver χρησιμοποιείται από περίπου το 70% του Yahoo! Ιαπωνία και Yahoo! Η Ταϊβάν είναι οι πιο δημοφιλείς μηχανές αναζήτησης στην Ιαπωνία και την Ταϊβάν, αντίστοιχα.

Ρωσία και ρωσόφωνες μηχανές αναζήτησης

Σύμφωνα με στοιχεία του LiveInternet τον Ιούνιο του 2015 σχετικά με την κάλυψη ερωτημάτων αναζήτησης στη ρωσική γλώσσα:

Ολόγλωσσο:
- Yahoo! (0,1%) και μηχανές αναζήτησης που ανήκουν σε αυτήν την εταιρεία: Inktomi, AltaVista , Alltheweb
Αγγλόφωνη και διεθνής:
- Ρωτήστε τον Jeeves(Μηχανισμός Teoma)
Ρωσόφωνο - οι περισσότερες "ρωσόφωνες" μηχανές αναζήτησης ευρετηριάζουν και αναζητούν κείμενα σε πολλές γλώσσες - Ουκρανικά, Λευκορωσικά, Αγγλικά, Ταταρικά και άλλες. Διαφέρουν από τα «ολόγλωσσα» συστήματα που ευρετηριάζουν όλα τα έγγραφα στη σειρά, στο ότι ευρετηριάζουν κυρίως πόρους που βρίσκονται σε ζώνες τομέα όπου κυριαρχεί η ρωσική γλώσσα, ή με άλλο τρόπο περιορίζουν τα ρομπότ τους σε ιστότοπους ρωσικής γλώσσας.

Ορισμένες από τις μηχανές αναζήτησης χρησιμοποιούν εξωτερικούς αλγόριθμους αναζήτησης.

Ποσοτικά δεδομένα της μηχανής αναζήτησης Google

Ο αριθμός των χρηστών του Διαδικτύου και των μηχανών αναζήτησης και οι απαιτήσεις των χρηστών για αυτά τα συστήματα αυξάνεται συνεχώς. Για να αυξηθεί η ταχύτητα αναζήτησης των απαραίτητων πληροφοριών, οι μεγάλες μηχανές αναζήτησης περιέχουν μεγάλο αριθμό διακομιστών. Οι διακομιστές συνήθως ομαδοποιούνται σε κέντρα διακομιστών (κέντρα δεδομένων). Οι δημοφιλείς μηχανές αναζήτησης διαθέτουν κέντρα διακομιστών διάσπαρτα σε όλο τον κόσμο.

Τον Οκτώβριο του 2012, η Google ξεκίνησε το έργο Where the Internet Lives, όπου δίνεται η ευκαιρία στους χρήστες να εξοικειωθούν με τα data centers της εταιρείας.

Η μηχανή αναζήτησης Google γνωρίζει τα εξής σχετικά με τη λειτουργία των κέντρων δεδομένων:

Η συνολική ισχύς όλων των κέντρων δεδομένων της Google, από το 2011, υπολογίστηκε σε 220 MW.
Όταν η Google σχεδίαζε να ανοίξει ένα νέο συγκρότημα τριών κτιρίων στο Όρεγκον το 2008 με συνολική επιφάνεια 6,5 εκατομμυρίων τετραγωνικών μέτρων, το περιοδικό Harper's υπολόγισε ότι ένα τόσο μεγάλο συγκρότημα καταναλώνει πάνω από 100 MW ηλεκτρικής ενέργειας, η οποία είναι συγκρίσιμη με την κατανάλωση ενέργειας μια πόλη 300.000 ανθρώπων.
Ο εκτιμώμενος αριθμός διακομιστών Google το 2012 είναι 1.000.000.
Οι δαπάνες της Google σε κέντρα δεδομένων ήταν 1,9 δισεκατομμύρια δολάρια το 2006 και 2,4 δισεκατομμύρια δολάρια το 2007.

Το μέγεθος του Παγκόσμιου Ιστού που ευρετηριάστηκε από την Google τον Δεκέμβριο του 2014 είναι περίπου 4,36 δισεκατομμύρια σελίδες.

Μηχανές αναζήτησης που λαμβάνουν υπόψη τις θρησκευτικές απαγορεύσεις

Η παγκόσμια εξάπλωση του Διαδικτύου και η αυξανόμενη δημοτικότητα των ηλεκτρονικών συσκευών στον αραβικό και μουσουλμανικό κόσμο, ιδίως στις χώρες της Μέσης Ανατολής και της ινδικής υποηπείρου, συνέβαλαν στην ανάπτυξη τοπικών μηχανών αναζήτησης που λαμβάνουν υπόψη τις ισλαμικές παραδόσεις. Τέτοιες μηχανές αναζήτησης περιέχουν ειδικά φίλτρα που βοηθούν τους χρήστες να αποφεύγουν την πρόσβαση σε απαγορευμένους ιστότοπους, όπως ιστότοπους με πορνογραφία, και τους επιτρέπουν να χρησιμοποιούν μόνο εκείνους τους ιστότοπους των οποίων το περιεχόμενο δεν είναι αντίθετο με την ισλαμική πίστη. Λίγο πριν τον μουσουλμανικό μήνα του Ραμαζανιού, τον Ιούλιο του 2013, παρουσιάστηκε ο κόσμος Χαλάλ γκουγκλάρισμα- ένα σύστημα που δίνει στους χρήστες μόνο halal "σωστούς" συνδέσμους φιλτράροντας τα αποτελέσματα αναζήτησης που λαμβάνονται από άλλες μηχανές αναζήτησης όπως η Google και το Bing. Δύο χρόνια νωρίτερα, τον Σεπτέμβριο του 2011, κυκλοφόρησε η μηχανή αναζήτησης I'mHalal για την εξυπηρέτηση χρηστών στη Μέση Ανατολή. Ωστόσο, αυτή η υπηρεσία αναζήτησης έπρεπε να κλείσει σύντομα, σύμφωνα με τον ιδιοκτήτη, λόγω έλλειψης χρηματοδότησης.

Η έλλειψη επενδύσεων και ο αργός ρυθμός διάδοσης της τεχνολογίας στον μουσουλμανικό κόσμο έχει εμποδίσει την πρόοδο και παρεμπόδισε την επιτυχία μιας σοβαρής ισλαμικής μηχανής αναζήτησης. Η αποτυχία τεράστιων επενδύσεων σε διαδικτυακά έργα του μουσουλμανικού τρόπου ζωής, ένα από τα οποία ήταν Μουξλίμ. Έχει λάβει εκατομμύρια δολάρια από επενδυτές όπως η Rite Internet Ventures και τώρα - σύμφωνα με την τελευταία ανάρτηση από το I'mHalal πριν κλείσει - έχει την αμφίβολη ιδέα ότι «το επόμενο Facebook ή Google μπορεί να είναι μόνο στη Μέση Ανατολή . αν υποστηρίζεις τη λαμπρή νεολαία μας». Παρόλα αυτά, οι ισλαμικοί ειδικοί του Διαδικτύου είναι απασχολημένοι εδώ και χρόνια με το να προσδιορίζουν τι είναι ή όχι σύμφωνα με τη Σαρία και ταξινομούν τους ιστότοπους ως "χαλάλ" ή "χαράμ". Όλες οι πρώην και οι τρέχουσες ισλαμικές μηχανές αναζήτησης είναι απλώς ένα ειδικά ευρετηριασμένο σύνολο δεδομένων ή είναι μεγάλες μηχανές αναζήτησης όπως το Google, το Yahoo και το Bing με κάποιο είδος συστήματος φιλτραρίσματος που χρησιμοποιείται για να εμποδίζει τους χρήστες να έχουν πρόσβαση σε ιστότοπους χαραάμ, όπως ιστότοποι σχετικά με το γυμνό. LGBT, τζόγος και οτιδήποτε άλλο θεωρείται αντιισλαμικό.

Μεταξύ άλλων θρησκευτικών μηχανών αναζήτησης, το Jewogle, η εβραϊκή έκδοση της Google και το SeekFind.org, ένας χριστιανικός ιστότοπος που περιλαμβάνει φίλτρα για να κρατούν τους χρήστες μακριά από περιεχόμενο που θα μπορούσε να υπονομεύσει ή να αποδυναμώσει την πίστη τους, είναι κοινές.

Προσωπικά αποτελέσματα και φυσαλίδες φίλτρων

Πολλές μηχανές αναζήτησης, όπως η Google και το Bing, χρησιμοποιούν αλγόριθμους για να μαντέψουν επιλεκτικά ποιες πληροφορίες θα ήθελε να δει ένας χρήστης με βάση τις προηγούμενες δραστηριότητές του στο σύστημα. Ως αποτέλεσμα, οι ιστότοποι εμφανίζουν μόνο πληροφορίες που συνάδουν με τα προηγούμενα ενδιαφέροντα του χρήστη. Αυτό το φαινόμενο ονομάζεται «φυσαλίδα φίλτρου».

Όλα αυτά οδηγούν στο γεγονός ότι οι χρήστες λαμβάνουν πολύ λιγότερες πληροφορίες που έρχονται σε αντίθεση με την άποψή τους και απομονώνονται πνευματικά στη δική τους «φούσκα πληροφοριών». Έτσι, το «φαινόμενο της φούσκας» μπορεί να έχει αρνητικές συνέπειες για τη διαμόρφωση της κοινής γνώμης.

Προκατάληψη μηχανών αναζήτησης

Αν και οι μηχανές αναζήτησης είναι προγραμματισμένες να ταξινομούν ιστότοπους με βάση κάποιο συνδυασμό της δημοτικότητας και της συνάφειάς τους, η πραγματικότητα είναι ότι η πειραματική έρευνα δείχνει ότι διάφοροι πολιτικοί, οικονομικοί και κοινωνικοί παράγοντες επηρεάζουν τα SERP.

Αυτή η προκατάληψη μπορεί να είναι άμεσο αποτέλεσμα οικονομικών και εμπορικών διαδικασιών: οι εταιρείες που διαφημίζονται σε μια μηχανή αναζήτησης μπορεί να γίνουν πιο δημοφιλείς στα οργανικά αποτελέσματα αναζήτησης σε αυτήν τη μηχανή αναζήτησης. Η κατάργηση των αποτελεσμάτων αναζήτησης που δεν συμμορφώνονται με τους τοπικούς νόμους είναι ένα παράδειγμα της επιρροής των πολιτικών διαδικασιών. Για παράδειγμα, η Google δεν θα εμφανίσει ορισμένους νεοναζιστικούς ιστότοπους στη Γαλλία και τη Γερμανία, όπου η άρνηση του Ολοκαυτώματος είναι παράνομη.

Η μεροληψία μπορεί επίσης να είναι συνέπεια κοινωνικών διαδικασιών, καθώς οι αλγόριθμοι των μηχανών αναζήτησης έχουν σχεδιαστεί συχνά για να αποκλείουν μη μορφοποιημένες απόψεις προς όφελος πιο «δημοφιλών» αποτελεσμάτων. Οι αλγόριθμοι ευρετηρίασης των μεγάλων μηχανών αναζήτησης δίνουν προτεραιότητα στους αμερικανικούς ιστότοπους.

Η βόμβα αναζήτησης είναι ένα παράδειγμα προσπάθειας χειραγώγησης των αποτελεσμάτων αναζήτησης για πολιτικούς, κοινωνικούς ή εμπορικούς λόγους.

δείτε επίσης

Qwika
Ηλεκτρονική βιβλιοθήκη#Λίστες βιβλιοθήκες και συστήματα
Γραμμή εργαλείων για προγραμματιστές Ιστού

Σημειώσεις

Βιβλιογραφία

Ashmanov I. S., Ivanov A.A.Προώθηση ιστοσελίδων σε μηχανές αναζήτησης. - M. : Williams, 2007. - 304 p. - ISBN 978-5-8459-1155-1.
Baikov V.D.Διαδίκτυο. Αναζήτηση πληροφοριών. Προώθηση ιστοσελίδας. - Αγία Πετρούπολη. : BHV-Petersburg, 2000. - 288 p. - ISBN 5-8206-0095-9.
Kolisnichenko D. N.Μηχανές αναζήτησης και προώθηση ιστοσελίδων στο Διαδίκτυο. - Μ.: Διαλεκτική, 2007. - 272 σελ. - ISBN 978-5-8459-1269-5.

Lande D.V.Αναζήτηση γνώσεων στο Διαδίκτυο. - Μ. : Διαλεκτική, 2005. - 272 σελ. - ISBN 5-8459-0764-0.

Lande D.V., Snarsky A. A., Bezsudnov I.V.Διαδίκτυο: Πλοήγηση σε σύνθετα δίκτυα: μοντέλα και αλγόριθμοι. - M.: Librokom (Editorial URSS), 2009. - 264 p. - ISBN 978-5-397-00497-8.

Chu H., Rosenthal M.

Παρόμοια άρθρα

Εντολή DECLARE CURSOR γενικοί κανόνες Τι είναι ο δρομέας sql

Ένας ρητός δρομέας είναι μια δήλωση SELECT που ορίζεται ρητά στην ενότητα δήλωσης του προγράμματος. Όταν δηλώνεται ένας ρητός δρομέας, του δίνεται ένα όνομα. Για εντολές INSERT, UPDATE, MERGE και DELETE, δεν μπορούν να οριστούν ρητά δρομείς....
Ρωσικές μηχανές αναζήτησης

Σε μια εποχή που μόλις ξεκινούσε η ανάπτυξη του Διαδικτύου, ο όγκος των διαθέσιμων πληροφοριών ήταν σχετικά μικρός και οι χρήστες του δικτύου ήταν λίγοι. Στα αρχικά στάδια της ανάπτυξης του δικτύου, χρησιμοποιήθηκε από υπαλλήλους πανεπιστημίων και έρευνας ...
Αιτίες και θεραπείες

Μερικές φορές το πρόγραμμα περιήγησης μπορεί να ειδοποιήσει τον χρήστη ότι παρουσιάστηκε σφάλμα σεναρίου. Αυτό ισχύει και για τον τυπικό Internet Explorer. Σε αυτό, παρεμπιπτόντως, μια τέτοια αποτυχία συμβαίνει πιο συχνά από ό, τι σε άλλα προγράμματα περιήγησης. Τι μπορεί να προκαλεί αυτό το πρόβλημα...
ετικέτα τίτλου - τίτλος σελίδας

Λέω αμέσως ότι σε αυτό το άρθρο δεν θα βρείτε ένα ανόητο σύνολο ανόητων συμβουλών, όπως να προσδιορίσετε το μέγεθος του Τίτλου ή την αριθμητική τιμή της πυκνότητας του κλειδιού. Όλα αυτά είναι ένα σπάνιο παιχνίδι που έχει εξαπλωθεί στο δίκτυο σαν ιός ... Η βάση της σωστής ορθογραφίας ...
Ρωσικές μηχανές αναζήτησης

Στο Διαδίκτυο, ένας ειδικός ιστότοπος στον οποίο ο χρήστης, μετά από ένα δεδομένο αίτημα, μπορεί να λάβει συνδέσμους σε ιστότοπους που ταιριάζουν με αυτό το αίτημα. Το σύστημα αναζήτησης αποτελείται από τρία στοιχεία: 1 ρομπότ αναζήτησης. 2 ευρετήρια συστήματος. και 3...
Τίτλος σελίδας - τι είναι και τι πρέπει να είναι;

Γεια σας φίλοι! Ήρθε πάλι η ώρα για χρήσιμες θεωρητικές αναρτήσεις. Και σήμερα θα ήθελα να μιλήσω για την πιο σημαντική ετικέτα - τον τίτλο. Ποιος είναι ο Τίτλος της σελίδας, τι επηρεάζει, πώς να συνθέσετε σωστά τον τίτλο από άποψη SEO, τι μπορεί να ...