গুগল কীভাবে কোনো শব্দের কোটি-কোটি ফলাফল নিয়ে হাজির হয়?

গুগল বা যে কোন অনুসন্ধক (search engine) যে কাজগুলি করে তার বিভিন্ন অঙ্গের মাধ্যমে তা সংক্ষেপে বলি।
১. হামাগুড়ি (crawling): এটি একটি পদ্ধতি যা মাকড়সার মতো আন্তর্জাল (internet) বেয়ে আন্তর্জালের পাতাগুলিকে (webpages) একত্রিত করে।
২. সূচিবদ্ধকরণ (indexing): এটি আরেকটি পদ্ধতি যেটার মাধ্যমে সেই সব পাতা থেকে শব্দগুলিকে (words) কে আলাদ করে শব্দতালিকা (wordlist / dictionary) তৈরী করা হয়। এরপরে প্রত্যেক শব্দের জন্য কোন কোন পাতায় তারা রয়েছে তার একটি তালিকা করা হয় — যা দেখতে একদমই বইয়ের শেষে যে index থাকে তারই মতো।
৩. অনুসন্ধান (searching): একটি নতুন বইয়ের কোথায় একটি বিশেষ বিষয় আলোচিত আছে তা খুঁজতে আপনি যেমন index দেখেন ও তারপর সেই পাতায় যান – পাতাগুলোর অনুসন্ধান ঠিক সেভাবেই হয়। কিন্তু তাতে অনেক পাতায় উঠে আসে।
৪. অগ্রাধিকার করণ (ranking): অনুসন্ধক বা সার্চ ইঞ্জিনের এটাই সবচেয়ে গুরুত্বপূর্ণ অঙ্গ – এবং এর গুণবত্তার ওপরেই একটি অনুসন্ধকের ব্যবসায়িক বৰ্তমান ও ভবিষ্যৎ নির্ভর করে। অনুসন্ধানের শেষে যে পাতাগুলো এলো যাদের মধ্যে আপনার খোঁজা শবদ বা শবদগুচ্ছ গুলো আছে কোন পাতাটি বেশি তথ্যসমৃদ্ধ এবং গ্রহণ যযোগ্য (more informative and acceptable ) — সেটি করাই এই অঙ্গের কাজ।
শবদ – শবদ মিল (term based similarity) অর্থাৎ আপনার প্রশ্নের শব্দের সাথে একটি পাতার মধ্যে থাকা শব্দের মিল, আপেক্ষিক অনুপাত – এসবের মাধ্যমে একটা সংখ্যাগত মিল অঙ্ক কষে বের করা হয়। কিন্তু, সেটা যথেষ্ট নয়।
আন্তর্জালের পাতাগুলি একে অপরের সাথে যুক্ত। সেই সংযোগের থেকেও একটা ধারণা পাওয়া যায় যে কোন পাতাটি বেশি গুরুত্বপূর্ণ। সেরকমই একটি algorithm -PageRank যা গুগলের প্রাথমিক যুগান্তকারী algorithm. কিন্তু আরো অনেক algorithms রয়েছে।

Livereportbd

Latest growing bangla news portal titled Livereportbd offers to know Sports, Entertainment, Education, Lifestyle, National, World, etc.

Leave a Reply

Your email address will not be published. Required fields are marked *