เครื่องมือค้นหา

จาก Wikipedia สารานุกรมเสรี
ข้ามไปที่การนำทางข้ามไปที่การค้นหา
ผลการค้นหาคำว่า "จันทรุปราคา" ในเครื่องมือค้นหารูปภาพบนเว็บ

เครื่องมือค้นหาเป็นระบบซอฟต์แวร์ที่ถูกออกแบบมาเพื่อดำเนินการค้นหาเว็บ ( ค้นหาข้อมูลในอินเทอร์เน็ต ) ซึ่งหมายถึงการค้นหาเวิลด์ไวด์เว็บอย่างเป็นระบบสำหรับข้อมูลเฉพาะที่ระบุไว้ในต้นฉบับเดิมคำค้นหาเว็บ ผลการค้นหาจะถูกนำเสนอโดยทั่วไปในสายของผลมักจะเรียกว่าเป็นเครื่องมือค้นหาหน้าผลลัพธ์ (SERPs) ข้อมูลที่อาจจะมีการผสมผสานของการเชื่อมโยงไปยังหน้าเว็บรูปภาพวิดีโอ, infographicsบทความงานวิจัยและประเภทอื่น ๆ ไฟล์ เครื่องมือค้นหาบางรายการยังขุดข้อมูลที่มีอยู่ในฐานข้อมูลหรือเปิดไดเรกทอรี ซึ่งแตกต่างจากเว็บไดเรกทอรีซึ่งมีการรักษาโดยเฉพาะบรรณาธิการมนุษย์เครื่องมือค้นหายังรักษาเวลาจริงข้อมูลโดยการเรียกใช้อัลกอริทึมในโปรแกรมรวบรวมข้อมูลเว็บ เนื้อหาบนอินเทอร์เน็ตที่ไม่ได้มีความสามารถในการค้นหาโดยเครื่องมือค้นหาเว็บอธิบายไว้โดยทั่วไปเป็นเว็บลึก

ประวัติ[ แก้ไข]

ไทม์ไลน์ ( รายการทั้งหมด )
ปีเครื่องยนต์สถานะปัจจุบัน
พ.ศ. 2536W3Catalogคล่องแคล่ว
Aliwebคล่องแคล่ว
JumpStationไม่ได้ใช้งาน
WWW หนอนไม่ได้ใช้งาน
พ.ศ. 2537WebCrawlerคล่องแคล่ว
Go.comไม่ใช้งานจะเปลี่ยนเส้นทางไปยัง Disney
ไลโคสคล่องแคล่ว
Infoseekไม่ใช้งานจะเปลี่ยนเส้นทางไปยัง Disney
พ.ศ. 2538ถ่อย! ค้นหาใช้งานอยู่ในขั้นต้นเป็นฟังก์ชันการค้นหาสำหรับYahoo! ไดเร็กทอรี
Daumคล่องแคล่ว
แมกเจลแลนไม่ได้ใช้งาน
ตื่นเต้นคล่องแคล่ว
SAPOคล่องแคล่ว
MetaCrawlerคล่องแคล่ว
AltaVistaไม่ได้ใช้งาน Yahoo! ในปี 2546 ตั้งแต่ปี 2556 เปลี่ยนเส้นทางไปยัง Yahoo!
พ.ศ. 2539RankDexไม่ได้ใช้งานซึ่งรวมอยู่ในBaiduในปี 2000
Dogpileใช้งานอยู่ผู้รวบรวม
Inktomiไม่ได้ใช้งาน Yahoo!
HotBotคล่องแคล่ว
ถาม Jeevesใช้งานอยู่ (rebranded ask.com)
พ.ศ. 2540AOL NetFindใช้งานอยู่ (การค้นหา AOL ที่เปลี่ยนโฉมใหม่ตั้งแต่ปี 2542)
ทางตอนเหนือของแสงไม่ได้ใช้งาน
ยานเดกซ์คล่องแคล่ว
พ.ศ. 2541Googleคล่องแคล่ว
Ixquickใช้งานในชื่อ Startpage.com
ค้นหา MSNใช้งานเป็น Bing
Empasไม่ใช้งาน (ผสานกับ NATE)
พ.ศ. 2542AlltheWebไม่ใช้งาน (URL ถูกเปลี่ยนเส้นทางไปยัง Yahoo!)
GenieKnowsใช้งานอยู่และเปลี่ยนชื่อเป็น Yellowee (เปลี่ยนเส้นทางไปที่ justlocalbusiness.com)
Naverคล่องแคล่ว
Teomaใช้งานอยู่ (© APN, LLC)
พ.ศ. 2543ไป่ตู้คล่องแคล่ว
Exaleadไม่ได้ใช้งาน
Gigablastคล่องแคล่ว
พ.ศ. 2544คาร์ทูไม่ได้ใช้งาน
พ.ศ. 2546Info.comคล่องแคล่ว
Scroogleไม่ได้ใช้งาน
พ.ศ. 2547A9.comไม่ได้ใช้งาน
คลุ้มคลั่งใช้งานอยู่ (เป็น Yippy)
Mojeekคล่องแคล่ว
โซโกวคล่องแคล่ว
2548ค้นหาฉันไม่ได้ใช้งาน
KidzSearchใช้งานอยู่ Google Search
พ.ศ. 2549เฉยๆไม่ใช้งานผสานกับSogou
Quaeroไม่ได้ใช้งาน
Search.comคล่องแคล่ว
ชาช่าไม่ได้ใช้งาน
Ask.comคล่องแคล่ว
ค้นหาสดใช้งานเป็น Bing ค้นหา MSN ที่เปลี่ยนชื่อใหม่
พ.ศ. 2550วิกิพีเดียไม่ได้ใช้งาน
Sprooseไม่ได้ใช้งาน
การค้นหา Wikiaไม่ได้ใช้งาน
Blackle.comใช้งานอยู่ Google Search
พ.ศ. 2551พาวเวอร์เซ็ตไม่ใช้งาน (เปลี่ยนเส้นทางไปยัง Bing)
Picollatorไม่ได้ใช้งาน
Viewziไม่ได้ใช้งาน
โบกามิไม่ได้ใช้งาน
LeapFishไม่ได้ใช้งาน
ฟอเรสเทิลไม่ใช้งาน (เปลี่ยนเส้นทางไปยัง Ecosia)
เป็ดคล่องแคล่ว
2552BingLive Search ที่ใช้งานอยู่และเปลี่ยนชื่อแบรนด์
เยโบลไม่ได้ใช้งาน
Mugurdyไม่ได้ใช้งานเนื่องจากขาดเงินทุน
ลูกเสือ (Goby)คล่องแคล่ว
NATEคล่องแคล่ว
Ecosiaคล่องแคล่ว
Startpage.comใช้งานเครื่องยนต์น้องสาวของ Ixquick
พ.ศ. 2553Blekkoไม่มีการใช้งานขายให้กับ IBM
Cuilไม่ได้ใช้งาน
ยานเดกซ์ (ภาษาอังกฤษ)คล่องแคล่ว
Parsijooคล่องแคล่ว
2554ยาซีใช้งานP2P
2555โวลูเนียไม่ได้ใช้งาน
พ.ศ. 2556Qwantคล่องแคล่ว
2557เอเจรินActive, เคิร์ด / Sorani
Swisscowsคล่องแคล่ว
2558ยูซคล่องแคล่ว
Cliqzไม่ได้ใช้งาน
2559Kiddleใช้งานอยู่ Google Search

ก่อนทศวรรษที่ 1990 [ แก้ไข]

ระบบค้นหาข้อมูลที่เผยแพร่ซึ่งมีจุดมุ่งหมายเพื่อเอาชนะความยากลำบากที่เพิ่มมากขึ้นในการค้นหาข้อมูลในดัชนีรวมศูนย์ของงานวิทยาศาสตร์ที่เพิ่มขึ้นเรื่อย ๆ ได้รับการอธิบายไว้ในปี 1945 โดยVannevar Bushผู้เขียนบทความในThe Atlantic Monthlyชื่อ " As We May Think " [1 ]ซึ่งเขาจินตนาการห้องสมุดของการวิจัยที่มีคำอธิบายประกอบเชื่อมต่อไม่แตกต่างจากที่ทันสมัยเชื่อมโยงหลายมิติ [2] การวิเคราะห์การเชื่อมโยงในที่สุดก็จะกลายเป็นองค์ประกอบที่สำคัญของเครื่องมือค้นหาผ่านขั้นตอนวิธีการเช่นเทคโนโลยี Hyper ค้นหาและPageRank [3] [4]

1990s: กำเนิดของเครื่องมือค้นหา[ แก้ไข]

เครื่องมือค้นหาอินเทอร์เน็ตครั้งแรกก่อนวันเปิดตัวครั้งแรกของเว็บในเดือนธันวาคม 1990: ใครเป็นผู้ใช้วันที่ค้นหากลับไปปี 1982 [5]และข้อมูล Knowbot บริการค้นหาของผู้ใช้หลายเครือข่ายที่ถูกนำมาใช้ครั้งแรกในปี 1989 [6]เอกสารที่แรกที่เดียว เครื่องมือค้นหาที่ค้นหาไฟล์เนื้อหาคือไฟล์FTPคือArchieซึ่งเปิดตัวเมื่อวันที่ 10 กันยายน พ.ศ. 2533 [7]

ก่อนเดือนกันยายน 1993 World Wide Webได้รับการจัดทำดัชนีด้วยมือทั้งหมด มีรายการเว็บเซิร์ฟเวอร์ที่แก้ไขโดยTim Berners-Leeและโฮสต์บนเว็บเซิร์ฟเวอร์CERNภาพรวมของรายการหนึ่งในปี 1992 ยังคงอยู่[8]แต่เมื่อเว็บเซิร์ฟเวอร์มากขึ้นเรื่อย ๆ รายการส่วนกลางก็ไม่สามารถติดตามได้อีกต่อไป บนไซต์NCSAมีการประกาศเซิร์ฟเวอร์ใหม่ภายใต้ชื่อ "มีอะไรใหม่!" [9]

เครื่องมือแรกที่ใช้สำหรับการค้นหาเนื้อหา (เมื่อเทียบกับผู้ใช้) บนอินเทอร์เน็ตเป็นอาร์ชี [10]ชื่อนี้ย่อมาจาก "archive" โดยไม่มี "v"., [11]สร้างโดยAlan Emtage [11] [12] [13] [14] นักศึกษาด้านวิทยาการคอมพิวเตอร์ที่มหาวิทยาลัย McGillในมอนทรีออลรัฐควิเบกประเทศแคนาดา . โปรแกรมดาวน์โหลดรายชื่อไดเร็กทอรีของไฟล์ทั้งหมดที่อยู่บนไซต์ FTP ( File Transfer Protocol ) ที่ไม่ระบุชื่อสาธารณะเพื่อสร้างฐานข้อมูลที่สามารถค้นหาได้ของชื่อไฟล์ อย่างไรก็ตามArchie Search Engineไม่ได้จัดทำดัชนีเนื้อหาของไซต์เหล่านี้เนื่องจากปริมาณข้อมูลมี จำกัด จึงสามารถค้นหาด้วยตนเองได้ทันที

การเพิ่มขึ้นของโกเฟอร์ (ที่สร้างขึ้นในปี 1991 โดยมาร์ค McCahillที่มหาวิทยาลัยมินนิโซตา ) นำไปสู่สองโปรแกรมค้นหาใหม่, เวโรนิก้าและจั๊กเช่นเดียวกับอาร์ชีพวกเขาค้นหาชื่อไฟล์และชื่อที่เก็บไว้ในระบบดัชนี Gopher Veronica ( V ery E asy R odent- O riented N et-wide I ndex to C omputerized A rchives) ให้การค้นหาคำหลักของชื่อเมนู Gopher ส่วนใหญ่ในรายการ Gopher ทั้งหมด Jughead ( J onzy's U niversal G opherH ierarchy E xcavation ครั้งD isplay) คือเครื่องมือสำหรับการได้รับข้อมูลจากเซิร์ฟเวอร์เมนูโกเฟอร์ที่เฉพาะเจาะจง แม้ว่าชื่อของเครื่องมือค้นหา " Archie Search Engine " ไม่ได้อ้างอิงถึงชุดหนังสือการ์ตูนของ Archieแต่ " Veronica " และ " Jughead " เป็นตัวละครในซีรีส์ดังกล่าวจึงอ้างอิงถึงรุ่นก่อน

ในช่วงฤดูร้อนปี 1993 ไม่มีเครื่องมือค้นหาสำหรับเว็บแม้ว่าจะมีการดูแลแคตตาล็อกเฉพาะทางจำนวนมากด้วยมือก็ตามOscar Nierstraszจากมหาวิทยาลัยเจนีวาเขียนชุดของสคริปต์Perlซึ่งสะท้อนหน้าเหล่านี้เป็นระยะและเขียนใหม่เป็นรูปแบบมาตรฐาน สิ่งนี้เป็นพื้นฐานสำหรับW3Catalogซึ่งเป็นเครื่องมือค้นหาแบบดั้งเดิมตัวแรกของเว็บซึ่งเปิดตัวเมื่อวันที่ 2 กันยายน พ.ศ. 2536 [15]

ในเดือนมิถุนายน พ.ศ. 2536 แมทธิวเกรย์จากนั้นที่MITได้ผลิตสิ่งที่น่าจะเป็นหุ่นยนต์เว็บตัวแรกคือWorld Wide Web WandererตามPerlและใช้มันสร้างดัชนีที่เรียกว่า จุดประสงค์ของ Wanderer คือการวัดขนาดของ World Wide Web ซึ่งทำได้จนถึงปลายปี 1995 Aliwebเครื่องมือค้นหาที่สองของเว็บปรากฏตัวในเดือนพฤศจิกายน 1993 Aliweb ไม่ได้ใช้หุ่นยนต์เว็บแต่ขึ้นอยู่กับการแจ้งเตือนจากเว็บไซต์แทน ผู้ดูแลระบบของการมีอยู่ในแต่ละไซต์ของไฟล์ดัชนีในรูปแบบเฉพาะ

JumpStation (สร้างในเดือนธันวาคม พ.ศ. 2536 [16]โดยJonathon Fletcher ) ใช้เว็บโรบ็อตเพื่อค้นหาหน้าเว็บและสร้างดัชนีและใช้เว็บฟอร์มเป็นส่วนต่อประสานกับโปรแกรมสืบค้นข้อมูล ดังนั้นจึงเป็นเครื่องมือค้นหาทรัพยากรWWW ตัวแรกที่รวมคุณสมบัติที่สำคัญสามประการของเครื่องมือค้นหาเว็บ (การรวบรวมข้อมูลการจัดทำดัชนีและการค้นหา) ตามที่อธิบายไว้ด้านล่าง เนื่องจากทรัพยากรที่มีอยู่อย่าง จำกัด บนแพลตฟอร์มที่ทำงานอยู่การจัดทำดัชนีและด้วยเหตุนี้การค้นหาจึง จำกัด เฉพาะชื่อเรื่องและส่วนหัวที่พบในหน้าเว็บที่โปรแกรมรวบรวมข้อมูลพบ

หนึ่งในเครื่องมือค้นหาที่ใช้โปรแกรมรวบรวมข้อมูล "ข้อความทั้งหมด" แรกคือWebCrawlerซึ่งออกมาในปี 1994 ซึ่งแตกต่างจากรุ่นก่อนคืออนุญาตให้ผู้ใช้ค้นหาคำใด ๆ ในหน้าเว็บใดก็ได้ซึ่งได้กลายเป็นมาตรฐานสำหรับเครื่องมือค้นหาหลักทั้งหมดตั้งแต่นั้นเป็นต้นมา นอกจากนี้ยังเป็นเครื่องมือค้นหาที่คนทั่วไปรู้จักกันอย่างแพร่หลาย นอกจากนี้ในปี 1994 Lycos (ซึ่งเริ่มต้นที่มหาวิทยาลัย Carnegie Mellon ) ได้เปิดตัวและกลายเป็นความพยายามทางการค้าที่สำคัญ

เครื่องมือค้นหายอดนิยมอันดับแรกบนเว็บคือYahoo! ค้นหา[17]ผลิตภัณฑ์แรกจากYahoo!ก่อตั้งโดยJerry YangและDavid Filoในเดือนมกราคม 1994 เป็นเว็บไดเร็กทอรีชื่อYahoo! ไดเรกทอรีในปี 1995 มีการเพิ่มฟังก์ชันการค้นหาซึ่งช่วยให้ผู้ใช้สามารถค้นหา Yahoo! ทำเนียบ! [18] [19]มันกลายเป็นวิธีที่ได้รับความนิยมมากที่สุดวิธีหนึ่งสำหรับผู้คนในการค้นหาหน้าเว็บที่น่าสนใจ แต่ฟังก์ชันการค้นหาทำงานบนไดเรกทอรีเว็บแทนที่จะเป็นสำเนาหน้าเว็บแบบเต็มข้อความ

ไม่นานหลังจากนั้นเครื่องมือค้นหาจำนวนหนึ่งก็ปรากฏตัวขึ้นและแย่งชิงความนิยม เหล่านี้รวมถึงเจลลัน , Excite , Infoseek , Inktomi , ไฟภาคเหนือและAltaVistaผู้ค้นหาข้อมูลยังสามารถเรียกดูไดเร็กทอรีแทนการค้นหาตามคีย์เวิร์ด

ในปี 1996 Robin Li ได้พัฒนาอัลกอริธึมการให้คะแนนเว็บไซต์RankDexสำหรับการจัดอันดับหน้าผลลัพธ์ของเครื่องมือค้นหา[20] [21] [22]และได้รับสิทธิบัตรของสหรัฐอเมริกาสำหรับเทคโนโลยีนี้ [23]เป็นเครื่องมือค้นหาแรกที่ใช้การเชื่อมโยงหลายมิติเพื่อวัดคุณภาพของเว็บไซต์ที่จัดทำดัชนี[24]ก่อนหน้านี้มีการจดสิทธิบัตรอัลกอริทึมที่คล้ายกันมากซึ่งยื่นโดยGoogle ในสองปีต่อมาในปี 1998 [25]แลร์รีเพจอ้างถึงงานของหลี่ในบางส่วน สิทธิบัตรของเขาสำหรับ PageRank ในสหรัฐอเมริกา [26] Li ภายหลังใช้เทคโนโลยี Rankdex ของเขาสำหรับBaidu เสิร์ชเอนจินซึ่งก่อตั้งโดย Robin Li ในประเทศจีนและเปิดตัวในปี 2000

ในปีพ. ศ. 2539 Netscapeต้องการมอบข้อเสนอพิเศษให้กับเครื่องมือค้นหาหนึ่งรายการในฐานะเครื่องมือค้นหาที่โดดเด่นบนเว็บเบราว์เซอร์ของ Netscape มีความสนใจอย่างมากที่ทำให้ Netscape ทำข้อตกลงกับเครื่องมือค้นหาหลักห้ารายการ: ในราคา $ 5 ล้านต่อปีเครื่องมือค้นหาแต่ละรายการจะหมุนเวียนอยู่ในหน้าเครื่องมือค้นหาของ Netscape เครื่องยนต์ห้าตัว ได้แก่ Yahoo !, Magellan, Lycos, Infoseek และ Excite [27] [28]

Googleนำมาใช้ความคิดในการขายคำค้นหาในปี 1998 จาก บริษัท เครื่องมือค้นหาเล็ก ๆ ชื่อgoto.com ความเคลื่อนไหวนี้มีผลอย่างมากต่อธุรกิจ SE ซึ่งเปลี่ยนจากการดิ้นรนไปสู่ธุรกิจที่ทำกำไรได้มากที่สุดแห่งหนึ่งในอินเทอร์เน็ต [29]

เครื่องมือค้นหายังเป็นที่รู้จักกันว่าเป็นดาวที่สว่างที่สุดในอินเทอร์เน็ตที่คลั่งไคล้การลงทุนซึ่งเกิดขึ้นในช่วงปลายทศวรรษที่ 1990 [30]หลาย บริษัท เข้ามาในตลาดไม่ยี่หระที่ได้รับการบันทึกกำไรในช่วงของพวกเขาประชาชนทั่วไปครั้งแรก บางรายได้ลบเครื่องมือค้นหาสาธารณะของตนออกและทำการตลาดรุ่นสำหรับองค์กรเท่านั้นเช่น Northern Light บริษัท เครื่องมือค้นหาหลายแห่งจมอยู่ในฟองสบู่ดอทคอมซึ่งเป็นตลาดที่เกิดจากการเก็งกำไรซึ่งพุ่งสูงสุดในปี 2533 และสิ้นสุดในปี 2543

ยุค 2000 - ปัจจุบัน: โพสต์ฟองสบู่ดอทคอม[ แก้ไข]

ประมาณปี 2000 เครื่องมือค้นหาของ Google มีชื่อเสียงมากขึ้น[31]บริษัท บรรลุผลลัพธ์ที่ดีกว่าสำหรับการค้นหาจำนวนมากด้วยอัลกอริทึมที่เรียกว่าเพจแรงก์ตามที่อธิบายไว้ในเอกสารAnatomy ของ Search Engine ที่เขียนโดยSergey BrinและLarry Pageซึ่งเป็นผู้ก่อตั้ง Google ในเวลาต่อมา[4]อัลกอริทึมแบบวนซ้ำนี้จัดอันดับหน้าเว็บตามจำนวนและ PageRank ของเว็บไซต์และหน้าเว็บอื่น ๆ ที่เชื่อมโยงไปที่นั่นโดยมีหลักฐานว่าหน้าที่ดีหรือเป็นที่ต้องการมีการเชื่อมโยงมากกว่าหน้าอื่น ๆ สิทธิบัตรของ Larry Page สำหรับ PageRank อ้างถึงสิทธิบัตรRankDexก่อนหน้านี้ของRobin Liว่ามีอิทธิพล[26]Google ยังคงรักษาอินเทอร์เฟซที่เรียบง่ายให้กับเครื่องมือค้นหา ในทางตรงกันข้ามหลายคู่แข่งฝังเครื่องมือค้นหาในเว็บพอร์ทัล ในความเป็นจริงเครื่องมือค้นหาของ Google กลายเป็นที่นิยมเพื่อให้เครื่องมือหลอกโผล่ออกมาเช่นผู้สมัครลึกลับ

ภายในปี 2000 Yahoo! ได้ให้บริการค้นหาโดยใช้เครื่องมือค้นหาของ Inktomi ถ่อย! เข้าซื้อ Inktomi ในปี 2002 และOverture (ซึ่งเป็นเจ้าของAlltheWebและ AltaVista) ในปี 2003 Yahoo! เปลี่ยนมาใช้เครื่องมือค้นหาของ Google จนถึงปี 2547 เมื่อเปิดตัวเครื่องมือค้นหาของตัวเองโดยอาศัยเทคโนโลยีรวมของการเข้าซื้อกิจการ

Microsoftเปิดตัว MSN Search ครั้งแรกในฤดูใบไม้ร่วงปี 2541 โดยใช้ผลการค้นหาจาก Inktomi ในช่วงต้นปี 2542 เว็บไซต์เริ่มแสดงรายชื่อจากLooksmartผสมผสานกับผลลัพธ์จาก Inktomi ในช่วงเวลาสั้น ๆ ในปี 2542 MSN Search ใช้ผลลัพธ์จาก AltaVista แทน ในปี 2004 Microsoftเริ่มเปลี่ยนไปใช้เทคโนโลยีการค้นหาของตนเองซึ่งขับเคลื่อนโดยโปรแกรมรวบรวมข้อมูลเว็บของตัวเอง(เรียกว่าmsnbot )

Bingซึ่งเป็นเครื่องมือค้นหาแบรนของ Microsoft เปิดตัวเมื่อวันที่ 1 มิถุนายน 2552 ในวันที่ 29 กรกฎาคม 2552 Yahoo! และ Microsoft ได้สรุปข้อตกลงที่Yahoo! การค้นหาจะขับเคลื่อนโดยเทคโนโลยี Microsoft Bing

ในฐานะของ 2019 ใช้งานเครื่องมือค้นหา crawlers รวมถึงผู้ที่จากGoogle , Sogou , Baidu , Bing , Gigablast , Mojeek , DuckDuckGoและYandex

วิธีการ[ แก้ไข]

เครื่องมือค้นหาจะดูแลกระบวนการต่อไปนี้แบบเรียลไทม์:

  1. การรวบรวมข้อมูลเว็บ
  2. การจัดทำดัชนี
  3. กำลังค้นหา[32]

เครื่องมือค้นหาเว็บรับข้อมูลโดยการรวบรวมข้อมูลเว็บจากไซต์หนึ่งไปยังอีกไซต์หนึ่ง "สไปเดอร์" จะตรวจหาชื่อไฟล์มาตรฐานrobots.txtที่ส่งถึงมัน ไฟล์ robots.txt มีคำสั่งสำหรับสไปเดอร์การค้นหาโดยบอกว่าหน้าใดต้องรวบรวมข้อมูลและหน้าใดที่ไม่ต้องรวบรวมข้อมูล หลังจากการตรวจสอบสำหรับ robots.txt และทั้งหามันหรือไม่แมงมุมส่งกลับข้อมูลบางอย่างที่จะจัดทำดัชนีขึ้นอยู่กับปัจจัยหลายอย่างเช่นชื่อ, เนื้อหาของหน้าเว็บ, JavaScript , การ Cascading Style Sheets (CSS) หัวหรือข้อมูลเมตาในเมตาแท็ก HTML. หลังจากที่มีการรวบรวมข้อมูลหน้าเว็บจำนวนหนึ่งจำนวนข้อมูลที่จัดทำดัชนีหรือเวลาที่ใช้บนเว็บไซต์สไปเดอร์จะหยุดรวบรวมข้อมูลและดำเนินการต่อไป "[N] o โปรแกรมรวบรวมข้อมูลของเว็บอาจรวบรวมข้อมูลเว็บที่เข้าถึงได้ทั้งหมดเนื่องจากเว็บไซต์ที่ไม่มีที่สิ้นสุดกับดักแมงมุมสแปมและลักษณะอื่น ๆ ของเว็บจริงโปรแกรมรวบรวมข้อมูลจึงใช้นโยบายการรวบรวมข้อมูลแทนเพื่อพิจารณาว่าควรพิจารณาการรวบรวมข้อมูลของไซต์เมื่อใด เพียงพอเว็บไซต์บางแห่งมีการรวบรวมข้อมูลอย่างละเอียดถี่ถ้วนในขณะที่เว็บไซต์อื่น ๆ รวบรวมข้อมูลได้เพียงบางส่วนเท่านั้น " [33]

การจัดทำดัชนีหมายถึงการเชื่อมโยงคำและโทเค็นที่สามารถกำหนดได้อื่น ๆ ที่พบบนหน้าเว็บกับชื่อโดเมนและฟิลด์ที่ใช้HTMLการเชื่อมโยงถูกสร้างขึ้นในฐานข้อมูลสาธารณะซึ่งพร้อมใช้งานสำหรับการค้นหาเว็บ ข้อความค้นหาจากผู้ใช้อาจเป็นคำเดียวคำหลายคำหรือประโยคก็ได้ ดัชนีช่วยให้ค้นหาข้อมูลที่เกี่ยวข้องกับแบบสอบถามได้เร็วที่สุด[32]เทคนิคบางอย่างในการจัดทำดัชนีและการแคชเป็นความลับทางการค้าในขณะที่การรวบรวมข้อมูลเว็บเป็นกระบวนการที่ตรงไปตรงมาในการเยี่ยมชมไซต์ทั้งหมดอย่างเป็นระบบ

ระหว่างการเข้าชมโดยสไปเดอร์เวอร์ชันแคชของเพจ (เนื้อหาบางส่วนหรือทั้งหมดที่จำเป็นในการแสดงผล) ที่เก็บไว้ในหน่วยความจำการทำงานของเครื่องมือค้นหาจะถูกส่งไปยังผู้สอบถามอย่างรวดเร็ว หากการเยี่ยมชมเกินกำหนดเครื่องมือค้นหาสามารถทำหน้าที่เป็นเว็บพร็อกซีแทนได้ ในกรณีนี้หน้าเว็บอาจแตกต่างจากข้อความค้นหาที่จัดทำดัชนี [32]หน้าแคชมีลักษณะของเวอร์ชันที่มีการจัดทำดัชนีคำไว้ก่อนหน้านี้ดังนั้นหน้าเวอร์ชันแคชจะมีประโยชน์กับเว็บไซต์เมื่อหน้าจริงหายไป แต่ปัญหานี้ยังถือว่าเป็นรูปแบบที่ไม่รุนแรงของlinkrot .

สถาปัตยกรรมระดับสูงของโปรแกรมรวบรวมข้อมูลเว็บมาตรฐาน

โดยปกติเมื่อผู้ใช้เข้าสู่แบบสอบถามเป็นเครื่องมือค้นหามันเป็นไม่กี่คำหลัก [34]ดัชนีแล้วมีชื่อของเว็บไซต์ที่มีคำหลักและสิ่งเหล่านี้จะได้รับทันทีจากดัชนี ภาระการประมวลผลจริงอยู่ในการสร้างหน้าเว็บที่เป็นรายการผลการค้นหา: ทุกหน้าในรายการทั้งหมดจะต้องถ่วงน้ำหนักตามข้อมูลในดัชนี [32]จากนั้นรายการผลการค้นหาอันดับต้น ๆ ต้องการการค้นหาสร้างใหม่และมาร์กอัปของตัวอย่างข้อมูลแสดงบริบทของคำหลักที่ตรงกัน นี่เป็นเพียงส่วนหนึ่งของการประมวลผลผลการค้นหาแต่ละหน้าเว็บที่ต้องการและหน้าอื่น ๆ (ถัดจากด้านบนสุด) ต้องการการประมวลผลโพสต์นี้มากขึ้น

นอกเหนือจากการค้นหาคีย์เวิร์ดง่ายๆแล้วเครื่องมือค้นหายังเสนอตัวดำเนินการที่ขับเคลื่อนด้วย GUI หรือคำสั่งและพารามิเตอร์การค้นหาเพื่อปรับแต่งผลการค้นหา สิ่งเหล่านี้ให้การควบคุมที่จำเป็นสำหรับผู้ใช้ที่มีส่วนร่วมในลูปข้อเสนอแนะที่ผู้ใช้สร้างขึ้นโดยการกรองและการให้น้ำหนักในขณะที่ปรับแต่งผลการค้นหาโดยให้หน้าเริ่มต้นของผลการค้นหาแรก ตัวอย่างเช่นตั้งแต่ปี 2550 เครื่องมือค้นหา Google.com อนุญาตให้หนึ่งกรองตามวันที่โดยคลิก "แสดงเครื่องมือค้นหา" ในคอลัมน์ซ้ายสุดของหน้าผลการค้นหาเริ่มต้นจากนั้นเลือกช่วงวันที่ที่ต้องการ[35]นอกจากนี้ยังสามารถถ่วงน้ำหนักตามวันที่ได้เนื่องจากแต่ละหน้ามีเวลาแก้ไข เครื่องมือค้นหาส่วนใหญ่รองรับการใช้งานไฟล์ผู้ประกอบการบูลีน AND, OR และ NOT ไปยังผู้ใช้ช่วยเหลือปรับแต่งการค้นหาตัวดำเนินการบูลีนใช้สำหรับการค้นหาตามตัวอักษรที่อนุญาตให้ผู้ใช้ปรับแต่งและขยายเงื่อนไขของการค้นหา เครื่องยนต์จะค้นหาคำหรือวลีตรงตามที่ป้อน เครื่องมือค้นหาบางอย่างมีคุณลักษณะขั้นสูงที่เรียกว่าการค้นหาความใกล้เคียงซึ่งช่วยให้ผู้ใช้สามารถกำหนดระยะห่างระหว่างคำหลักได้[32]นอกจากนี้ยังมีการค้นหาตามแนวคิดที่การวิจัยเกี่ยวข้องกับการใช้การวิเคราะห์ทางสถิติในหน้าที่มีคำหรือวลีที่คุณค้นหา

ประโยชน์ของเครื่องมือค้นหาขึ้นอยู่กับความเกี่ยวข้องของชุดผลลัพธ์ที่ให้กลับมา แม้ว่าอาจมีหน้าเว็บหลายล้านหน้าที่มีคำหรือวลีบางหน้า แต่บางหน้าอาจมีความเกี่ยวข้องเป็นที่นิยมหรือเชื่อถือได้มากกว่าหน้าอื่น ๆ เครื่องมือค้นหาส่วนใหญ่ใช้วิธีการจัดอันดับผลลัพธ์เพื่อให้ได้ผลลัพธ์ที่ "ดีที่สุด" ก่อน เครื่องมือค้นหาจะตัดสินใจอย่างไรว่าหน้าเว็บใดเหมาะสมที่สุดและลำดับที่ผลลัพธ์ควรจะแสดงแตกต่างกันไปในแต่ละเครื่องมือ[32]วิธีการนี้ยังเปลี่ยนแปลงอยู่ตลอดเวลาเมื่อมีการเปลี่ยนแปลงการใช้อินเทอร์เน็ตและเทคนิคใหม่ ๆ ที่พัฒนาขึ้น เครื่องมือค้นหามีสองประเภทหลักที่พัฒนาขึ้น: หนึ่งคือระบบของคำหลักที่กำหนดไว้ล่วงหน้าและตามลำดับชั้นที่มนุษย์ได้ตั้งโปรแกรมไว้อย่างกว้างขวาง อีกระบบหนึ่งคือระบบที่สร้าง " ดัชนีกลับหัว " โดยการวิเคราะห์ข้อความที่ระบุ รูปแบบแรกนี้อาศัยคอมพิวเตอร์มากขึ้นในการทำงานจำนวนมาก

เครื่องมือค้นหาเว็บส่วนใหญ่เป็นกิจการทางการค้าที่ได้รับการสนับสนุนจากรายได้จากการโฆษณาและด้วยเหตุนี้บางรายการจึงอนุญาตให้ผู้โฆษณามีรายชื่อของตนอยู่ในอันดับที่สูงขึ้นในผลการค้นหาโดยมีค่าธรรมเนียม เครื่องมือค้นหาที่ไม่รับเงินสำหรับผลการค้นหาสร้างรายได้จากการแสดงโฆษณาที่เกี่ยวข้องกับการค้นหาควบคู่ไปกับผลลัพธ์ของเครื่องมือค้นหาปกติ เครื่องมือค้นหาสร้างรายได้ทุกครั้งที่มีคนคลิกโฆษณาเหล่านี้ [36]

การค้นหาในท้องถิ่น[ แก้ไข]

การค้นหาในพื้นที่เป็นกระบวนการที่เพิ่มประสิทธิภาพความพยายามของธุรกิจในท้องถิ่น พวกเขามุ่งเน้นไปที่การเปลี่ยนแปลงเพื่อให้แน่ใจว่าการค้นหาทั้งหมดสอดคล้องกัน เป็นสิ่งสำคัญเนื่องจากหลายคนกำหนดว่าพวกเขาวางแผนจะไปที่ไหนและจะซื้ออะไรจากการค้นหา [37]

ส่วนแบ่งการตลาด[ แก้ไข]

ณ เมษายน 2021 , [38] Googleเป็นเครื่องมือค้นหาที่ใช้มากที่สุดในโลกโดยมีส่วนแบ่งตลาด 92.24% และมากที่สุดในโลกเครื่องมือค้นหาอื่น ๆ ที่ใช้คือ:

รัสเซียและเอเชียตะวันออก[ แก้]

ในรัสเซียยานเดกซ์มีส่วนแบ่งการตลาด 61.9% เทียบกับ 28.3% ของ Google [39]ในประเทศจีน Baidu เป็นเครื่องมือค้นหาที่ได้รับความนิยมมากที่สุด [40] Naverพอร์ทัลการค้นหาพื้นบ้านของเกาหลีใต้ใช้สำหรับการค้นหาออนไลน์ 70% ในประเทศ [41] Yahoo! ญี่ปุ่นและYahoo! ไต้หวันเป็นช่องทางที่ได้รับความนิยมสูงสุดสำหรับการค้นหาทางอินเทอร์เน็ตในญี่ปุ่นและไต้หวันตามลำดับ [42]จีนเป็นหนึ่งในไม่กี่ประเทศที่ Google ไม่อยู่ในสามอันดับแรกของเครื่องมือค้นหาเว็บสำหรับส่วนแบ่งการตลาด ก่อนหน้านี้ Google เป็นเครื่องมือค้นหาอันดับต้น ๆ ในจีน แต่ต้องถอนตัวไปหลังจากไม่ปฏิบัติตามกฎหมายของจีน [43]

ยุโรป[ แก้ไข]

ตลาดของประเทศส่วนใหญ่ในสหภาพยุโรปถูกครอบงำโดย Google ยกเว้นสาธารณรัฐเช็กซึ่งSeznamเป็นคู่แข่งที่แข็งแกร่ง [44]

อคติของเครื่องมือค้นหา[ แก้ไข]

แม้ว่าเครื่องมือค้นหาจะได้รับการตั้งโปรแกรมให้จัดอันดับเว็บไซต์โดยพิจารณาจากความนิยมและความเกี่ยวข้องร่วมกัน แต่การศึกษาเชิงประจักษ์บ่งชี้อคติทางการเมืองเศรษฐกิจและสังคมต่างๆในข้อมูลที่พวกเขาให้[45] [46]และสมมติฐานพื้นฐานเกี่ยวกับเทคโนโลยี [47]อคติเหล่านี้อาจจะเป็นผลโดยตรงจากกระบวนการทางเศรษฐกิจและการค้า (เช่น บริษัท ที่ลงโฆษณากับเครื่องมือค้นหาที่สามารถกลายเป็นยังเป็นที่นิยมมากขึ้นในการของการค้นหาอินทรีย์ผล) และกระบวนการทางการเมือง (เช่นการกำจัดของผลการค้นหาเพื่อให้สอดคล้อง ตามกฎหมายท้องถิ่น) [48]ตัวอย่างเช่น Google จะไม่เปิดเผยเว็บไซต์นีโอนาซีบางแห่งในฝรั่งเศสและเยอรมนีซึ่งเป็นการปฏิเสธการฆ่าล้างเผ่าพันธุ์ ผิดกฎหมาย

อคติอาจเป็นผลมาจากกระบวนการทางสังคมเนื่องจากอัลกอริทึมของเครื่องมือค้นหามักได้รับการออกแบบมาเพื่อยกเว้นมุมมองที่ไม่เป็นบรรทัดฐานเพื่อสนับสนุนผลลัพธ์ที่ "เป็นที่นิยม" มากกว่า [49]อัลกอริทึมการจัดทำดัชนีของเครื่องมือค้นหาที่สำคัญเบี่ยงเบนไปสู่ความครอบคลุมของไซต์ในสหรัฐอเมริกามากกว่าเว็บไซต์จากประเทศที่ไม่ใช่สหรัฐอเมริกา [46]

Google Bombingเป็นตัวอย่างหนึ่งของความพยายามที่จะปรับเปลี่ยนผลการค้นหาด้วยเหตุผลทางการเมืองสังคมหรือการค้า

นักวิชาการหลายคนได้ศึกษาการเปลี่ยนแปลงทางวัฒนธรรมที่เรียกโดยเครื่องมือค้นหา[50]และการเป็นตัวแทนของหัวข้อที่ถกเถียงกันบางอย่างในผลของพวกเขาเช่นการก่อการร้ายในไอร์แลนด์ , [51] การเปลี่ยนแปลงภูมิอากาศปฏิเสธ , [52]และทฤษฎีสมคบคิด [53]

ผลลัพธ์ที่กำหนดเองและกรองฟองอากาศ[ แก้ไข]

เครื่องมือค้นหาจำนวนมากเช่น Google และ Bing ให้ผลลัพธ์ที่กำหนดเองตามประวัติกิจกรรมของผู้ใช้ นำไปสู่การนี้จะมีผลกระทบที่ได้รับการเรียกว่าฟองกรองคำนี้อธิบายถึงปรากฏการณ์ที่เว็บไซต์ใช้อัลกอริทึมเพื่อเลือกคาดเดาข้อมูลที่ผู้ใช้ต้องการดูโดยพิจารณาจากข้อมูลเกี่ยวกับผู้ใช้ (เช่นตำแหน่งพฤติกรรมการคลิกในอดีตและประวัติการค้นหา) ด้วยเหตุนี้เว็บไซต์จึงมักจะแสดงเฉพาะข้อมูลที่เห็นด้วยกับมุมมองในอดีตของผู้ใช้ สิ่งนี้ทำให้ผู้ใช้อยู่ในสถานะของการแยกทางปัญญาโดยไม่ขัดต่อข้อมูล ตัวอย่างที่สำคัญคือผลการค้นหาส่วนบุคคลของ Google และสตรีมข่าวส่วนตัวของFacebookอ้างอิงจากEli Pariserซึ่งเป็นผู้บัญญัติศัพท์ขึ้นมาผู้ใช้จะได้รับมุมมองที่ขัดแย้งกันน้อยลงและถูกแยกทางสติปัญญาในฟองข้อมูลของตนเอง Pariser กล่าวถึงตัวอย่างที่ผู้ใช้รายหนึ่งค้นหา "BP" ใน Google และได้รับข่าวการลงทุนเกี่ยวกับBritish Petroleumในขณะที่ผู้ค้นหารายอื่นได้รับข้อมูลเกี่ยวกับการรั่วไหลของน้ำมัน Deepwater Horizonและหน้าผลการค้นหาทั้งสองหน้า "แตกต่างกันอย่างมาก" [54] [55] [56]ผลกระทบของฟองสบู่อาจมีผลกระทบเชิงลบต่อวาทกรรมของพลเมืองตามที่ปารีเซอร์กล่าว[57]เนื่องจากปัญหานี้ได้รับการระบุเครื่องมือค้นหาที่แข่งขันกันจึงพยายามหลีกเลี่ยงปัญหานี้โดยการไม่ติดตามหรือ "เดือด" ผู้ใช้เช่นDuckDuckGo. นักวิชาการคนอื่น ๆ ไม่ได้แบ่งปันมุมมองของ Pariser การค้นหาหลักฐานที่สนับสนุนวิทยานิพนธ์ของเขาไม่น่าเชื่อถือ [58]

เครื่องมือค้นหาทางศาสนา[ แก้ไข]

การเติบโตทั่วโลกของอินเทอร์เน็ตและสื่ออิเล็กทรอนิกส์ในโลกอาหรับและมุสลิมในช่วงทศวรรษที่ผ่านมาได้กระตุ้นให้ผู้นับถือศาสนาอิสลามในตะวันออกกลางและอนุทวีปเอเชียพยายามใช้เครื่องมือค้นหาของตนเองซึ่งเป็นพอร์ทัลการค้นหาที่กรองแล้วซึ่งจะช่วยให้ผู้ใช้สามารถ ดำเนินการค้นหาปลอดภัยมากขึ้นกว่าปกติค้นหาปลอดภัยกรองเหล่านี้เว็บพอร์ทัลอิสลามจัดหมวดหมู่เว็บไซต์กลายเป็นทั้ง " ฮาลาล " หรือ " Haram " ขึ้นอยู่กับการตีความของ"กฎของศาสนาอิสลาม" ImHalalออนไลน์ในเดือนกันยายน 2554 Halalgooglingออนไลน์ในเดือนกรกฎาคม 2013 สิ่งเหล่านี้ใช้ตัวกรองharamในคอลเล็กชันจากGoogleและBing (และอื่น ๆ ) [59]

ในขณะที่การขาดการลงทุนและเทคโนโลยีที่ช้าในโลกมุสลิมได้ขัดขวางความก้าวหน้าและขัดขวางความสำเร็จของเครื่องมือค้นหาอิสลามโดยกำหนดเป้าหมายเป็นผู้บริโภคหลักที่นับถือศาสนาอิสลามโครงการต่างๆเช่นMuxlimซึ่งเป็นเว็บไซต์วิถีชีวิตของชาวมุสลิมได้รับเงินหลายล้านดอลลาร์จากนักลงทุนเช่น Rite Internet Ventures และมันก็สะดุดเช่นกัน เครื่องมือค้นหาที่เน้นศาสนาอื่น ๆ ได้แก่ Jewogle, Google เวอร์ชันยิว, [60]และ SeekFind.org ซึ่งนับถือศาสนาคริสต์ SeekFind กรองไซต์ที่โจมตีหรือทำให้เสื่อมเสียศรัทธา [61]

การส่งเครื่องมือค้นหา[ แก้ไข]

การส่งเครื่องมือค้นหาเว็บเป็นกระบวนการที่ผู้ดูแลเว็บส่งเว็บไซต์ไปยังเครื่องมือค้นหาโดยตรง แม้ว่าบางครั้งการส่งเครื่องมือค้นหาจะถูกนำเสนอเพื่อส่งเสริมเว็บไซต์ แต่โดยทั่วไปแล้วก็ไม่จำเป็นเนื่องจากเครื่องมือค้นหาหลัก ๆ ใช้โปรแกรมรวบรวมข้อมูลเว็บซึ่งจะพบเว็บไซต์ส่วนใหญ่บนอินเทอร์เน็ตโดยไม่ได้รับความช่วยเหลือ พวกเขาสามารถส่งได้ครั้งละหนึ่งหน้าเว็บหรือสามารถส่งทั้งไซต์โดยใช้แผนผังเว็บไซต์ได้ แต่โดยปกติจะต้องส่งหน้าแรกเท่านั้นของเว็บไซต์เนื่องจากเครื่องมือค้นหาสามารถรวบรวมข้อมูลเว็บไซต์ที่ออกแบบมาอย่างดี มีเหตุผลสองประการที่เหลือในการส่งเว็บไซต์หรือหน้าเว็บไปยังเครื่องมือค้นหา: เพื่อเพิ่มเว็บไซต์ใหม่ทั้งหมดโดยไม่ต้องรอให้เครื่องมือค้นหาค้นพบและเพื่อให้มีการอัปเดตบันทึกของเว็บไซต์หลังจากการออกแบบใหม่จำนวนมาก

ซอฟต์แวร์ส่งเครื่องมือค้นหาบางรายการไม่เพียง แต่ส่งเว็บไซต์ไปยังเครื่องมือค้นหาหลายรายการเท่านั้น แต่ยังเพิ่มลิงก์ไปยังเว็บไซต์จากหน้าของตนเอง สิ่งนี้อาจเป็นประโยชน์ในการเพิ่มอันดับของเว็บไซต์เนื่องจากลิงก์ภายนอกเป็นปัจจัยที่สำคัญที่สุดอย่างหนึ่งในการจัดอันดับเว็บไซต์ อย่างไรก็ตาม John Mueller จากGoogleได้ระบุว่า "อาจนำไปสู่ลิงก์ที่ผิดปกติจำนวนมหาศาลสำหรับไซต์ของคุณ" ซึ่งส่งผลเสียต่อการจัดอันดับไซต์ [62]

ดูเพิ่มเติม[ แก้ไข]

  • การเปรียบเทียบเครื่องมือค้นหาเว็บ
  • การดึงข้อมูล
  • รายชื่อเครื่องมือค้นหา
  • การตอบคำถาม
  • กรองฟอง
  • ผลของ Google
  • การใช้เครื่องมือค้นหาเว็บในไลบรารี
  • เว็บความหมาย
  • เครื่องตรวจตัวสะกด
  • เครื่องมือพัฒนาเว็บ
  • เอฟเฟกต์การจัดการเครื่องมือค้นหา
  • ความเป็นส่วนตัวของเครื่องมือค้นหา

อ้างอิง[ แก้ไข]

  1. ^ "Search Engine History.com" www.searchenginehistory.com . สืบค้นเมื่อ2020-07-02 .
  2. ^ "รัฐเพนน์ WebAccess เข้าสู่ระบบการรักษาความปลอดภัย" webaccess.psu.edu สืบค้นเมื่อ2020-07-02 .
  3. ^ Marchiori, มัสซิโม (1997) "การแสวงหาข้อมูลที่ถูกต้องบนเว็บ: ไฮเปอร์เครื่องมือค้นหา" การดำเนินการของหกนานาชาติเวิลด์ไวด์เว็บประชุม (WWW6) สืบค้นเมื่อ2021-01-10 .
  4. ^ a b บรินเซอร์เกย์; เพจแลร์รี่ (1998). "กายวิภาคของขนาดใหญ่ Hypertextual เว็บ Search Engine" (PDF) การดำเนินการของเจ็ดนานาชาติเวิลด์ไวด์เว็บประชุม (WWW7) สืบค้นเมื่อ2021-01-10 .
  5. ^ "RFC 812 - NICNAME / WHOIS" ietf.org
  6. ^ "การเขียนโปรแกรม Knowbot: สนับสนุนระบบสำหรับตัวแทนมือถือ" cnri.reston.va.us .
  7. ^ Deutsch ปีเตอร์ (11 กันยายน 1990) "[ถัดไป] อินเทอร์เน็ตเซิร์ฟเวอร์เซิร์ฟเวอร์เก็บ (เป็นเรื่องของเสียงกระเพื่อม)" groups.google.com สืบค้นเมื่อ2017-12-29 .
  8. ^ "เว็บเซิร์ฟเวอร์ทั่วโลก" W3.org สืบค้นเมื่อ2012-05-14 .
  9. ^ "มีอะไรใหม่! กุมภาพันธ์ 1994" Home.mcom.com . สืบค้นเมื่อ2012-05-14 .
  10. ^ "ประวัติอินเทอร์เน็ต - เครื่องมือค้นหา" (จากการค้นหา Engine Watch ) Universiteit Leiden, เนเธอร์แลนด์กันยายน 2001 เว็บ:LeidenU-อาร์ชี
  11. ^ a b pcmag "อาร์ชี" . pcmag.com . สืบค้นเมื่อ2020-09-20 .
  12. ^ อเล็กซานดราซามูเอล "อลันพบ Emtage ดำ Technologist ผู้คิดค้นอาร์ชีแรกอินเตอร์เน็ต Search Engine" อิทากา. สืบค้นเมื่อ2020-09-20 .
  13. ^ ห่วงข่าวบาร์เบโดส "อลัน Emtage- บาร์เบโดสที่คุณควรรู้" loopnewsbarbados.com . สืบค้นเมื่อ2020-09-21 .
  14. ^ Dino Grandoni, Alan Emtage "อลัน Emtage: คนที่คิดค้น Search Engine แรกของโลก ( แต่ไม่ได้สิทธิบัตรมัน)" huffingtonpost .co.uk . สืบค้นเมื่อ2020-09-21 .
  15. ^ ออสการ์เนียร์สตรสซ์ (2 กันยายน 1993) "แคตตาล็อกที่สามารถค้นหาทรัพยากร WWW (ทดลอง)"
  16. ^ "เก็บข้อมูลของ NCSA อะไรใหม่ในธันวาคม 1993 หน้า" 2544-06-20. สืบค้นจากต้นฉบับเมื่อ 2001-06-20 . สืบค้นเมื่อ2012-05-14 .
  17. ^ "ผู้เสนอญัตติครั้งแรกคืออะไร" . SearchCIO TechTarget กันยายน 2005 สืบค้นเมื่อ5 กันยายน 2562 .
  18. ^ ออปปิทซ์มาร์คัส; Tomsu, Peter (2017). การคิดค้นศตวรรษแห่งคลาวด์: ความขุ่นมัวช่วยเปลี่ยนแปลงชีวิตเศรษฐกิจและเทคโนโลยีของเราได้อย่างไร สปริงเกอร์. หน้า 238. ISBN 9783319611617.
  19. ^ "ค้นหาของ Yahoo!" ถ่อย! . 28 พฤศจิกายน 1996 ที่จัดเก็บจากเดิมในวันที่ 28 พฤศจิกายน 1996 สืบค้นเมื่อ5 กันยายน 2562 .
  20. ^ กรีนเบิร์ก, แอนดี้ "คนที่เต้น Google" , Forbesนิตยสาร 5 ตุลาคม 2009
  21. ^ Yanhong Li, "Toward a Qualitative Search Engine," IEEE Internet Computing , vol. 2, ไม่ 4, หน้า 24–29 กรกฎาคม / ส.ค. พ.ศ. 2541ดอย : 10.1109 / 4236.707687
  22. ^ "เกี่ยวกับ: RankDex" , rankdex.com
  23. ^ USPTO "ระบบและวิธีการดึงเอกสารไฮเปอร์เท็กซ์"หมายเลขสิทธิบัตรของสหรัฐอเมริกา: 5920859 ผู้ประดิษฐ์: Yanhong Li วันที่ยื่น: 5 ก.พ. 2540 วันที่ออก: 6 ก.ค. 2542
  24. ^ "Baidu Vs Google: ฝาแฝดของ Search เทียบ" FourWeekMBA 18 กันยายน 2561 . สืบค้นเมื่อ16 มิถุนายน 2562 .
  25. ^ Altucher เจมส์ (18 มีนาคม 2011) "10 สิ่งที่ผิดปกติเกี่ยวกับ Google" ฟอร์บ สืบค้นเมื่อ16 มิถุนายน 2562 .
  26. ^ "วิธีการจัดอันดับสำหรับโหนดในฐานข้อมูลที่เชื่อมโยง" สิทธิบัตรของ Google สืบค้นเมื่อ 15 ตุลาคม 2558 . สืบค้นเมื่อ19 ตุลาคม 2558 .
  27. ^ "Yahoo! และ Netscape หมึกนานาชาติกระจายตกลง" (PDF) สืบค้นจากต้นฉบับ(PDF)เมื่อ 2013-11-16 . สืบค้นเมื่อ2009-08-12 .
  28. ^ "Browser Deals Push Netscape Stock Up 7.8%". Los Angeles Times. 1 April 1996.
  29. ^ Pursel, Bart. Search Engines. Penn State Pressbooks. Retrieved February 20, 2018.
  30. ^ Gandal, Neil (2001). "The dynamics of competition in the internet search engine market". International Journal of Industrial Organization. 19 (7): 1103–1117. doi:10.1016/S0167-7187(01)00065-0.
  31. ^ "Our History in depth". W3.org. Retrieved 2012-10-31.
  32. ^ a b c d e f Jawadekar, Waman S (2011), "8. Knowledge Management: Tools and Technology", Knowledge Management: Text & Cases, New Delhi: Tata McGraw-Hill Education Private Ltd, p. 278, ISBN 978-0-07-07-0086-4, retrieved November 23, 2012
  33. ^ Dasgupta, Anirban; Ghosh, Arpita; Kumar, Ravi; Olston, Christopher; Pandey, Sandeep; and Tomkins, Andrew. The Discoverability of the Web. http://www.arpitaghosh.com/papers/discoverability.pdf
  34. ^ Jansen, B. J., Spink, A., and Saracevic, T. 2000. Real life, real users, and real needs: A study and analysis of user queries on the web. Information Processing & Management. 36(2), 207-227.
  35. ^ Chitu, Alex (August 30, 2007). "Easy Way to Find Recent Web Pages". Google Operating System. Retrieved 22 February 2015.
  36. ^ "how search engine works?". GFO = 26 June 2018.
  37. ^ "What Is Local SEO & Why Local Search Is Important". Search Engine Journal. Retrieved 2020-04-26.
  38. ^ "Search Engine Market Share Worldwide". StatCounter GlobalStats. Retrieved May 8, 2021.
  39. ^ "Live Internet - Site Statistics". Live Internet. Retrieved 2014-06-04.
  40. ^ Arthur, Charles (2014-06-03). "The Chinese technology companies poised to dominate the world". The Guardian. Retrieved 2014-06-04.
  41. ^ "How Naver Hurts Companies' Productivity". The Wall Street Journal. 2014-05-21. Retrieved 2014-06-04.
  42. ^ "Age of Internet Empires". Oxford Internet Institute. Retrieved 15 August 2019.
  43. ^ Waddell, Kaveh (2016-01-19). "Why Google Quit China—and Why It's Heading Back". The Atlantic. Retrieved 2020-04-26.
  44. ^ Seznam Takes on Google in the Czech Republic. Doz.
  45. ^ Segev, El (2010). Google and the Digital Divide: The Biases of Online Knowledge, Oxford: Chandos Publishing.
  46. ^ a b Vaughan, Liwen; Mike Thelwall (2004). "Search engine coverage bias: evidence and possible causes". Information Processing & Management. 40 (4): 693–707. CiteSeerX 10.1.1.65.5130. doi:10.1016/S0306-4573(03)00063-3.
  47. ^ Jansen, B. J. and Rieh, S. (2010) The Seventeen Theoretical Constructs of Information Searching and Information Retrieval. Journal of the American Society for Information Sciences and Technology. 61(8), 1517-1534.
  48. ^ Berkman Center for Internet & Society (2002), "Replacement of Google with Alternative Search Systems in China: Documentation and Screen Shots", Harvard Law School.
  49. ^ Introna, Lucas; Helen Nissenbaum (2000). "Shaping the Web: Why the Politics of Search Engines Matters". The Information Society. 16 (3): 169–185. CiteSeerX 10.1.1.24.8051. doi:10.1080/01972240050133634. S2CID 2111039.
  50. ^ Hillis, Ken; Petit, Michael; Jarrett, Kylie (2012-10-12). Google and the Culture of Search. Routledge. ISBN 9781136933066.
  51. ^ Reilly, P. (2008-01-01). Spink, Prof Dr Amanda; Zimmer, Michael (eds.). 'Googling' Terrorists: Are Northern Irish Terrorists Visible on Internet Search Engines?. Information Science and Knowledge Management. 14. Springer Berlin Heidelberg. pp. 151–175. Bibcode:2008wsis.book..151R. doi:10.1007/978-3-540-75829-7_10. ISBN 978-3-540-75828-0. S2CID 84831583.
  52. ^ Hiroko Tabuchi, "How Climate Change Deniers Rise to the Top in Google Searches", The New York Times, Dec. 29, 2017. Retrieved November 14, 2018.
  53. ^ Ballatore, A (2015). "Google chemtrails: A methodology to analyze topic representation in search engines". First Monday. 20 (7). doi:10.5210/fm.v20i7.5597.
  54. ^ Parramore, Lynn (10 October 2010). "The Filter Bubble". The Atlantic. Retrieved 2011-04-20. Since Dec. 4, 2009, Google has been personalized for everyone. So when I had two friends this spring Google "BP," one of them got a set of links that was about investment opportunities in BP. The other one got information about the oil spill....
  55. ^ Weisberg, Jacob (10 June 2011). "Bubble Trouble: Is Web personalization turning us into solipsistic twits?". Slate. Retrieved 2011-08-15.
  56. ^ Gross, Doug (May 19, 2011). "What the Internet is hiding from you". CNN. Retrieved 2011-08-15. I had friends Google BP when the oil spill was happening. These are two women who were quite similar in a lot of ways. One got a lot of results about the environmental consequences of what was happening and the spill. The other one just got investment information and nothing about the spill at all.
  57. ^ Zhang, Yuan Cao; Séaghdha, Diarmuid Ó; Quercia, Daniele; Jambor, Tamas (February 2012). "Auralist: Introducing Serendipity into Music Recommendation" (PDF). ACM WSDM. doi:10.1145/2124295.2124300. S2CID 2956587.
  58. ^ O'Hara, K. (2014-07-01). "In Worship of an Echo". IEEE Internet Computing. 18 (4): 79–83. doi:10.1109/MIC.2014.71. ISSN 1089-7801. S2CID 37860225.
  59. ^ "New Islam-approved search engine for Muslims". News.msn.com. Archived from the original on 2013-07-12. Retrieved 2013-07-11.
  60. ^ "Jewogle - FAQ".
  61. ^ "Halalgoogling: Muslims Get Their Own "sin free" Google; Should Christians Have Christian Google? - Christian Blog". Christian Blog. 2013-07-25.
  62. ^ Schwartz, Barry (2012-10-29). "Google: Search Engine Submission Services Can Be Harmful". Search Engine Roundtable. Retrieved 2016-04-04.

Further reading[edit]

  • Steve Lawrence; C. Lee Giles (1999). "Accessibility of information on the web". Nature. 400 (6740): 107–9. Bibcode:1999Natur.400..107L. doi:10.1038/21987. PMID 10428673. S2CID 4347646.CS1 maint: multiple names: authors list (link)
  • Bing Liu (2007), Web Data Mining: Exploring Hyperlinks, Contents and Usage Data. Springer,ISBN 3-540-37881-2
  • Bar-Ilan, J. (2004). The use of Web search engines in information science research. ARIST, 38, 231–288.
  • Levene, Mark (2005). An Introduction to Search Engines and Web Navigation. Pearson.
  • Hock, Randolph (2007). The Extreme Searcher's Handbook.ISBN 978-0-910965-76-7
  • Javed Mostafa (February 2005). "Seeking Better Web Searches". Scientific American. 292 (2): 66–73. Bibcode:2005SciAm.292b..66M. doi:10.1038/scientificamerican0205-66.
  • Ross, Nancy; Wolfram, Dietmar (2000). "End user searching on the Internet: An analysis of term pair topics submitted to the Excite search engine". Journal of the American Society for Information Science. 51 (10): 949–958. doi:10.1002/1097-4571(2000)51:10<949::AID-ASI70>3.0.CO;2-5.
  • Xie, M.; et al. (1998). "Quality dimensions of Internet search engines". Journal of Information Science. 24 (5): 365–372. doi:10.1177/016555159802400509. S2CID 34686531.
  • Information Retrieval: Implementing and Evaluating Search Engines. MIT Press. 2010.

External links[edit]

  • Search Engines at Curlie