Cevap 1:

Merhaba Yash Makadiya,

Her ikisini de farklılaştırmak yerine ne anlama geldiğini söyleyeyim.

Büyük Veri, büyük miktarda veriyi işleme (depolama ve işleme) konseptidir. Büyük dediğimde, gigabayt -> terabayt -> petabayt -> zetabayt vb. Bu kavramın başlangıcında, bu verilerin dağıtılmış bir şekilde depolanmasını veya işlenmesini kolaylaştıran birçok yeni teknoloji bulduk. Apache Hadoop, bu verileri HDFS, MapReduce, Hive, Pig, HBase gibi alt projelerle işlemeye başlayan ilk teknolojilerden / çerçevelerden biridir.

Daha sonra, Büyük Verileri çok daha kolay ve verimli bir şekilde ele alan Storm, Spark, Cassandra, MongoDB, CouchBase DB vb.Gibi bazı gelişmiş teknolojileri görmeye başladık.

NoSQL - Bazen 'SQL olmayan' olarak adlandırılır ve çoğu zaman 'Yalnızca SQL' olarak adlandırılır, biçimlendirilmemiş, yapılandırılmamış verileri yapılandırılmış verilerle birlikte depolayabilen Veritabanlarına atıfta bulunur. Bunun Büyük Veri kavramının bir türevi olduğunu söyleyebilirsiniz. Bu büyük miktarda veri her zaman satır biçiminde gelmez. Günlükler, belgeler, düz dosyalar vb. Olabilir.

Bildiğim birkaç örnek:

Hbase, Cassandra - Sütunlu veritabanları

MongoDB, CouchBase DB - Belge (JSON) veritabanları

CouchBase DB, Oracle NoSQL DB - Anahtar / Değer çifti


Cevap 2:

Ölçeklenebilirliği nedeniyle çoğu zaman NoSQL'in Büyük Veri için en iyi olduğunu duyabiliriz. Büyük Veri, NoSQL, ilişkisel veritabanı (SQL tabanlı veritabanları) veya başka herhangi bir format olabilen büyük miktarda veriyi ifade eden bir terimdir.

Büyük miktardaki verilerden bazı yararlı bilgilerin çıkarılması oldukça karmaşıktır ve aynı zamanda ölçeklenebilirlik de önemli bir faktördür. Çoğunlukla, dağıtılmış sunucular büyük miktarda veriyi işlemek için kullanıyor, veriler hızla ölçekleniyorsa yeni sunucular ekleyerek depolama alanını genişletebiliriz. Bu çoklu sunucuları yönetmek kolay değildir, büyük veri üzerinde ilerleme sağlamak için özel tür yazılımlara ve algoritmalara ihtiyacımız vardır.

Resim: Veri Merkezi, Kaynak: Wikimedia Commons

Örneğin, Apache Spark, farklı sunuculardaki küme düğümlerine erişebilen bir küme bilgi işlem çerçevesidir. Daha fazla makine öğrenme algoritması kullanır.

NoSQL (Sadece SQL değil) veri depolamak için kullanılan bir veritabanıdır. İlişkisel veritabanlarının aksine, NoSQL, verileri depolamak için ilişkisel tabloları kullanmaz. NoSQL, anahtar / değer deposu, belge ve grafik gibi verileri depolamak için farklı yöntemler kullanır. İlişkisel veritabanlarıyla karşılaştırıldığında, NoSQL hızlı ve daha ölçeklenebilirdir.

NoSQL örnekleri: MongoDB, RethinkDB ve Apache Cassandra.