Αράχνη

Συγγραφέας: Peter Berry
Ημερομηνία Δημιουργίας: 18 Αύγουστος 2021
Ημερομηνία Ενημέρωσης: 12 Ενδέχεται 2024
Anonim
Ζουζούνια - Η Μικρή Αράχνη
Βίντεο: Ζουζούνια - Η Μικρή Αράχνη

Περιεχόμενο

Ορισμός - Τι σημαίνει Spider;

Στο con του Διαδικτύου, μια αράχνη είναι ένα εξειδικευμένο λογισμικό που έχει σχεδιαστεί για να ανιχνεύει συστηματικά και να περιηγεί στο World Wide Web συνήθως με σκοπό την ευρετηρίαση ιστοσελίδων για να τους παρέχει ως αποτελέσματα αναζήτησης για ερωτήματα αναζήτησης χρηστών. Η πιο διάσημη από αυτές τις αράχνες είναι το Googlebot, ο κύριος ανιχνευτής Googles, το οποίο βοηθά να διασφαλιστεί ότι τα σχετικά αποτελέσματα επιστρέφονται για ερωτήματα αναζήτησης.


Οι αράχνες είναι επίσης γνωστές ως crawlers ιστού, αναζήτηση bots ή απλά bots.

Εισαγωγή στη Microsoft Azure και το Microsoft Σε αυτό τον οδηγό θα μάθετε τι είναι το cloud computing και πώς η Microsoft Azure μπορεί να σας βοηθήσει να μεταφέρετε και να εκτελέσετε την επιχείρησή σας από το cloud.

Η Techopedia εξηγεί την Spider

Μια αράχνη είναι ουσιαστικά ένα πρόγραμμα που χρησιμοποιείται για τη συγκομιδή πληροφοριών από τον Παγκόσμιο Ιστό. Ανιχνεύει μέσω των σελίδων των ιστότοπων την εξαγωγή πληροφοριών και την ευρετηρίασή τους για μεταγενέστερη χρήση, συνήθως για τα αποτελέσματα των μηχανών αναζήτησης. Η αράχνη επισκέπτεται τους ιστότοπους και τις σελίδες τους μέσω των διαφόρων συνδέσεων προς και από τις σελίδες, οπότε μια σελίδα χωρίς έναν μοναδικό σύνδεσμο θα είναι δύσκολο να ευρετηριαστεί και μπορεί να καταταχθεί πολύ χαμηλά στη σελίδα αποτελεσμάτων αναζήτησης. Και αν υπάρχουν πολλοί σύνδεσμοι που δείχνουν σε μια σελίδα, αυτό θα σήμαινε ότι η σελίδα είναι δημοφιλής και θα εμφανίζεται ψηλότερα στα αποτελέσματα αναζήτησης.


Βήματα που σχετίζονται με την ανίχνευση ιστού:

  • Η αράχνη βρίσκει έναν ιστότοπο και αρχίζει να ανιχνεύει τις σελίδες του.
  • Η αράχνη αναγράφει τις λέξεις και τα περιεχόμενα του ιστότοπου.
  • Η αράχνη επισκέπτεται τους συνδέσμους που βρίσκονται στον ιστότοπο.

Οι αράχνες ή οι webcrawlers είναι απλά προγράμματα και ως εκ τούτου ακολουθούν συστηματικούς κανόνες που ορίζονται από τους προγραμματιστές. Οι ιδιοκτήτες ιστοτόπων μπορούν επίσης να μπουν σε αυτό, λέγοντας στην αράχνη ποια τμήματα του ιστότοπου θα ευρετηριαστούν και ποια δεν θα έπρεπε. Αυτό γίνεται με τη δημιουργία ενός αρχείου "robots.txt" που περιέχει οδηγίες για την αράχνη σχετικά με το ποια τμήματα να ευρετηριάσουν και τους συνδέσμους που ακολουθούν και ποια πρέπει να αγνοούν. Οι πιο σημαντικές αράχνες είναι εκείνες που ανήκουν σε μεγάλες μηχανές αναζήτησης όπως το Google, το Bing και το Yahoo και εκείνες που προορίζονται για την εξόρυξη δεδομένων και την έρευνα, αλλά υπάρχουν και κάποιες κακόβουλες αράχνες που έχουν γραφτεί για να βρουν και να συλλέξουν το χρήστη για να πουλήσουν στη διαφήμιση εταιρείες ή για να εντοπίσετε ευπάθειες στην ασφάλεια στο Web.