Nutch

Lucene Nutch
Geliştirici(ler)Apache Yazılım Derneği
Güncel sürüm0.9.0 / 2 Nisan 2007
Programlama diliJava
İşletim sistemiTüm platformlar
TürArama motoru
LisansApache Lisansı 2.0
Resmî sitesihttp://lucene.apache.org/nutch/
Kod deposu
  • github.com/apache/nutch
Bunu Vikiveri'de düzenleyin

Nutch, Lucene Java'nın arama ve listeleme bileşenlerini kullanarak açık kaynak kodlu bir arama motoru yaratma uğraşısıdır.

Özellikler

Uygulama tümüyle Java kullanılarak yazılmış ancak verinin, programlama dilinden bağımsız olmasına özen gösterilmiştir.

Nutch, oldukça kaliteli bir mimariye sahiptir ve şu tür eklentilerin geliştirilmesinde büyük kolaylık sağlamaktadır: Ortama özel ayrıştırma, veri toplama, sorgulama ve kümeleme.

Tarihçe

Nutch, Doug Cutting (Lucene ve Hadoop'un yaratıcısı) ve Mike Cafarella'nın ortak çalışmasının ürünüdür.

Haziran 2003'te 100 milyon sayfalık bir kısıtlı sürümle yaşama ilk adımı atan proje zaman içinde MapReduce özelliğine ve bir dağıtılmış dosya sistemine sahip olmuştur. Bu yeni özellikler daha sonra Hadoop projesine evrilmiştir.

Haziran 2005 itibarıyla Apache Incubator'dan ayrılmış olan proje, Lucene'in yardımcı projelerinden biri olarak değerlendirilmektedir.

Ölçeklendirilebilirlik

IBM, Nutch/Lucene'in başarımını[1] Ticari Ölçek Projesi (CSO) olarak adlandırılan bir yöntemle ölçmüştür.[2] Bulgular, Nutch/Lucene gibi yatay ölçeklendirilebilir sistemlerin Power5 gibi dikey ölçeklendirilebilir sistemlere göre daha yüksek bir başarıma ulaşma şanslarının yüksek olduğunu göstermiştir.

İlgili projeler

  • Hadoop - Kümelenmiş sistemlerde çalışan uygulamaları destekleyen bir Java eklentisi
  • nutchWAX28 Eylül 2011 tarihinde Wayback Machine sitesinde arşivlendi. - Çevrimiçi arşivlerde Nutch ile arama yapabilen bir uygulama
  • Sixearch - Kişilerin kendi belgelerini başkalarıyla paylaşmak için kullanabileceği bir ağ

Nutch kullanılarak geliştirilmiş arama motorları

  • Kelforum
  • KnowMyDestination
  • Krugle
  • mozDex
  • Wikia Search

Kaynakça

  1. ^ "Nutch arama motorunun ölçeklendirilebilirliği" (PDF). 20 Şubat 2009 tarihinde kaynağından arşivlendi (PDF). Erişim tarihi: 1 Şubat 2009. 
  2. ^ "Temel İşletim Sistemi Hazırlığı ve Ticari Bir Süperbilgisayarın Yapılışı" (PDF). 3 Aralık 2008 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 1 Şubat 2009. 

Dış bağlantılar

  • Resmi Web Sitesi 29 Ocak 2009 tarihinde Wayback Machine sitesinde arşivlendi.
  • Nutch: Açık Kaynak Kodlu Arama Motoru25 Ekim 2006 tarihinde Wayback Machine sitesinde arşivlendi. (2004) - ACM Queue Cilt 2, no. 2
  • Nutch'la ilgili bir yazı (2003) - Search Engine Watch
  • Nutch'la ilgili bir diğer yazı 6 Temmuz 2008 tarihinde Wayback Machine sitesinde arşivlendi. (2003) - Tech News World
  • Hadoop projesinin resmi web sayfası
  • g
  • t
  • d
Üst düzey projeler
  • Accumulo
  • ActiveMQ
  • Airflow
  • Ambari
  • Ant
  • Aries
  • Apache HTTP Server
  • APR
  • Avro
  • Axis
  • Axis2
  • Beam
  • Bloodhound
  • Brooklyn
  • Buildr
  • Calcite
  • Camel
  • CarbonData
  • Cassandra
  • Cayenne
  • Chemistry
  • CloudStack
  • Cocoon
  • Cordova
  • CouchDB
  • cTAKES
  • CXF
  • Derby
  • Directory
  • Drill
  • Druid
  • Empire-db
  • Felix
  • Flex
  • Flink
  • Flume
  • Geronimo
  • Giraph
  • Gump
  • Hadoop
  • HBase
  • Helix
  • Hive
  • Impala
  • Jackrabbit
  • James
  • Jena
  • Jini
  • JMeter
  • Kafka
  • Karaf
  • Kudu
  • Kylin
  • Lucene
  • Mahout
  • Marmotta
  • Maven
  • MINA
  • mod_perl
  • MyFaces
  • NetBeans
  • Nutch
  • OFBiz
  • Oozie
  • OpenEJB
  • OpenJPA
  • OpenNLP
  • OрenOffice
  • ORC
  • PDFBox
  • Parquet
  • Phoenix
  • POI
  • Pig
  • Pivot
  • Qpid
  • Roller
  • RocketMQ
  • Samza
  • ServiceMix
  • Shiro
  • SINGA
  • Sling
  • Solr
  • Spark
  • Storm
  • SpamAssassin
  • Sqoop
  • Struts 1
  • Struts 2
  • Subversion
  • Superset
  • SystemML
  • Tapestry
  • Thrift
  • Tika
  • Tomcat
  • Trafodion
  • Traffic Server
  • UIMA
  • Velocity
  • Wicket
  • Xalan
  • Xerces
  • XMLBeans
  • Yetus
  • ZooKeeper
Ortak projeler
  • BCEL
  • BSF
  • Daemon
  • Jelly
  • Logging
Kuluçka projeler
  • Iceberg
  • MXNet
  • NuttX
  • Taverna
  • XAP
Diğer projeler
Emekli projeler
  • Abdera
  • Apex
  • AxKit
  • Beehive
  • Bluesky
  • iBATIS
  • C++ Standard Library
  • Cactus
  • Click
  • Continuum
  • Deltacloud
  • Etch
  • Excalibur
  • Forrest
  • Hama
  • Harmony
  • HiveMind
  • Jakarta
  • Lenya
  • ODE
  • Shale
  • Shindig
  • Slide
  • Stanbol
  • Tuscany
  • Wave
  • Wink
Lisanslar