'बिग डेटा' - म्हणजे काय रे भाऊ?

आज तंत्रज्ञानाचा वेग आणि झपाटा इतका आहे की त्या वेगाने बावचळूनच जायला होते. त्यात सॉफ्टवेअर क्षेत्रातल्या सगळ्या ‘दादा’ कंपन्यांना 'मार्केट शेयर'वर ताबा मिळविणे गरजेचे असल्याने त्यातली स्पर्धा अतिशय जीवघेणी झालेली आहे. त्यामुळे ‘टाइम टू मार्केट’ ह्याला इतके महत्त्व आले आहे की थोडा उशीर झाला तर स्पर्धेतून बाहेर फेकले जाण्याची शक्यता असते. त्यामुळे मग एखादी संकल्पना घेऊन बाजारात त्यावर आधरित एक गरज निर्माण करून, त्यावर आधारित प्रॉडक्ट्स बनवून ती विकण्यासाठी ‘बाजारपेठ’ तयार करण्याचे काम ह्या बलाढ्य सॉफ्टवेअर कंपन्या नेमाने करत असतात. (ते आमच्या फायद्याचेच असते म्हणा, त्यावर आमची रोजी रोटी अबलंबून असते!)


चित्र: आंतरजालाहून साभार

आजकाल ढगाला कळ लागल्याप्रमाणे बदाबदा कोसळणारा ‘क्लाउड कंप्युटिंग’चा मारा विरला जातो ना जातो तोच ‘बिग डेटा’चा हाकारा चहूबाजूंकडून ऐकू येऊ लागलाय. मार्केटिंग आणि सेल्सवाले 'बिग डेटावर पेझेंटेशन तयार करा' असली मागणी उठताबसता करू लागले आहेत. मी एकाला विचारले, "व्हाय डु यु नीड दिस?" तर त्याचे म्हणणे असे की, "आय डोंन्ट नो रे बाबा, बट क्लायंट इज आस्किंग अबाउट अवर केपेबिलीटीज ऑन बिग डेटा अ‍ॅन्ड यु हॅव टु प्रोवाइड मी दॅट इन एनी केस!" आयबीएमने तर दूरचित्रवाणीवर ह्या ‘बिग डेटा’चे तारणहार आम्हीच असा जाहिरातींचा मारा चालू केला आहे. तर आता हा ‘बिग डेटा’ म्हणजे काय असा प्रश्न पडणे साहजिकच आहे. चला तर बघूयात, काय आहे हा एवढा मोठा ‘बिग डेटा’…

बिग डेटा म्हणजे काय ते बघण्यापूर्वी 'डेटा' म्हणजे काय ते आधि समजून घेवुयात. संगणकात साठवल्या जाणार्‍या माहितीचे मूलभूत एकक असते एक बीट आणि अशा आठ बिट्सचा एक बाइट (Byte) बनतो आणि ह्या 10,48,576 बाइट म्हणजे एक मेगाबाइट (1MB). तर संगणकात साठवली जाणारी माहिती ही ह्या बाइट्समध्ये, फाइल्सच्या स्वरूपात साठवाली जाते. जेव्हा आपण ‘मायक्रोसॉफ्ट वर्ड’ चालू करतो तेव्हा ह्या प्रोग्रामची फाइल मेमरीमध्ये आणून ती फाइल ऑपरेटिंग सिस्टिमकडून रन केली जाते. आता फक्त एकाच फाइलमध्ये सर्व माहिती साठवणे शक्य नसते, फाइलच्या आकाराला मर्यादा असल्यामुळे. त्यासाठी बाकीची माहिती इतर सपोर्टिंग फाइल्समध्ये साठवून ती योग्य वेळी वापरली जाते. त्यासाठी त्या इतर फाइल्सचा संदर्भ (reference) ‘मायक्रोसॉफ्ट वर्ड’च्या मूळ एक्झीक्युटेबल फाइलमध्ये नोंदवलेला असतो. योग्य वेळी तो संदर्भ वापरून हवी असलेली सपोर्टिंग फाइल उघडून त्यातली माहिती वाचली जाऊन वापरली जाते. हा मायक्रोसॉफ्ट वर्ड प्रोग्राम वापरून आपण डॉक्युमेंट्स बनवतो. ती डॉक्युमेंट्सही ह्या बाइट्समध्ये डॉक्युमेंट फाइलमध्ये साठवली जातात. तर डेटाचे मुलभूत एकक म्हणजे बाइट आणि तो साठवला जाण्याचे माध्यम म्हणजे फाइल.

ज्यावेळी संगणकाचा वापर माहिती प्रोसेसिंग करणारी वेगवेगळी अॅप्लिकेशन्स बनाविण्यासाठी केला जाऊ लागला आणि त्यांची गुंतागुंत (complexity) वाढून, ती अधिक वेगवान असण्याची गरज निर्माण झाली तेव्हा अशा वेगवेगळ्या संदर्भ साठवून ठेवलेल्या फाइल्स वेळोवेळी उघडून त्यातून माहिती वाचणे हे अॅप्लिकेशनच्या एकंदरीत वेगावर परिणाम करू लागले आणि त्यातून मग ‘रिलेशनल डेटाबेस’चा शोध लावला गेला. ह्यात अॅप्लिकेशनसाठी लागणारा आणि एकमेकाशी संबंध असलेला डेटा 'रो आणि कॉलम्स'च्या स्वरूपात डेटाबेस टेबल्समध्ये साठवला जाऊ लागला. जेव्हा हा परस्परसंबंधित डेटा ह्या रिलेशनल डेटाबेसमधून वाचला जायचा तो ‘डेटासेट’ स्वरूपात ह्या वेगवेगळ्या डेटाबेस टेबल्समधून एकत्र केला जायचा. पण संगणकाचा वापर वाढून, सर्व क्षेत्रांत जसेजसे संगणकीकरण होऊ लागले, तसेतसे हा डिजीटल डेटा मोठ्या प्रमाणात तयार होऊ लागला. तो प्रचंड डेटा साठवून, हवा तेव्हा वाचण्यासाठी, योग्य डेटासेटमध्ये उपलब्ध करून देण्यासाठी ओरॅकल, टेराडेटा, आयबीएम ह्यांसारख्या कंपन्यांनी त्यांची रिलेशनल डेटाबेस आणि डेटा वेअरहाउसिंगची उत्पादने विकसित करून ती बाजारात आणली. हा झाला ‘डेटा’चा मागोवा.

पण हा डेटा जसजसा वाढत होता तसा तो प्रोसेस करण्यासाठी, त्यातून हवी ती माहिती मिळविण्याची गुंतागुंत जशी जशी वाढत गेली तशी-तशी संगणकाची संगणनशक्तीही वाढणे गरजेचे होते. उदाहरणार्थ वेगवेगळ्या संदेशवाहक उपग्रहांकडून येणारा प्रचंड डेटा प्रोसेस करण्यासाठी शेकडो संगणकांची फौजही अपुरी पडू लागली तेव्हा ‘सुपरकॉम्प्युटर’चा शोध, तो प्रचंड डेटा प्रोसेस करण्यासाठी, लावला गेला. पण सुपरकॉम्प्युटर सर्वांनाच परवडणारा नव्हता आणि तेवढा प्रचंड डेटा प्रोसेस करण्याची निकडही तोपर्यंत व्यापारी तत्त्वावर भासलेली नव्हती.


चित्र: आंतरजालाहून साभार

पण पुढे इंटरनेट अवतरले आणि त्याने आपले दैनंदिन जीवन बघता बघता व्यापून टाकले आणि मग सुरू झाला खर्‍या अर्थाने माहितीचा विस्फोट. अक्षरशः लाखो टेराबाईट्स मध्ये डेटा वेगवेगळ्या डेटा सेंटर्समध्ये साठवला जाऊ लागला. आता हा माहितीचा विस्फोट म्हणजे नेमके काय? पडला ना प्रश्न? नाही? मग हा प्रश्न पडू द्या, विचारा हा प्रश्न स्वतःला? मिळाले उत्तर? नाही? हरकत नाही, सांगतो. आपल्या सर्वांच्या लाडक्या फेसबुकचे जगभरात अब्जावधी नोंदणीकृत सदस्य आहेत. ते सगळेजण फेसबुकवर आपापले स्टेटस सतत अपडेट करत असतात (कोण म्हणतंय रे मतांच्या पिंका टाकत असतात म्हणून). तर त्याचा आकडा आहे, दर दिवशी 2.7 बिलियन कमेंट्स, एक बिलियन म्हणजे एकावर 9 शून्य. ट्विटरवर 400 million ट्विट्स दिवसभरात केल्या जातात, यू-ट्यूबवर दर मिनिटाला साठ तास चालतील एवढे व्हिडियो अपलोड होत असतात. ह्या सगळ्यांचा दादा म्हणजे गूगल, ज्याला संगणक किंचितसा जरी वापरता येतो तो गूगलवर जाऊन येतोच येतो. पण नेमाने गूगल वापरणार्‍यांच्या हालचालींची नोंद हा गूगल नित्यनियमाने, गपगुमान करीत असतो. आता ह्या अब्जावधी वापरकर्त्यांचा हा डेटाही तेवढाच अवाढव्य असतो. ह्या शिवाय अॅमेझॉनसारखी असंख्य ऑनलाईन रिटेल दुकाने त्यांच्या वेबसाइट्सवर हजेरी लावणार्‍यांच्या आणि खरेदी करणार्‍यांच्या नोंदी त्यांच्या वेबलॉग्स मध्ये दर सेकंदाला करीत असतात. विश्वाच्या उत्पत्तीचा शोध घेण्याचा प्रयोग करणार्‍या सर्न (CERN) च्या प्रयोगशाळेत दर सेकंदाला 40 टेराबाइट एवढ्या नोंदी घेतल्या जात होत्या आणि घेतल्या जात आहेत. जगभरात लाखो ब्लॉगर्स त्यांच्या ब्लॉग्सवर दर मिनिटाला काही ना काही वेगवेगळ्या विषयांवर लिहीत असतात. पृथ्वीभोवती फिरणारे आणि दरवर्षी वाढत जाणारे उपग्रह पृथ्वीच्या वातावरणातली वेगवेगळी माहिती, छायाचित्रे दर सेकंदाला घेत असतात आणि ती साठवली जातात. जाऊदे मी दमलो आता, पण ही यादी संपणारी नाहीयेय. तर हा आहे सगळा ‘माहितीचा विस्फोट’.

तर, ह्या माहितीच्या विस्फोटातून तयार होणारा हा अवाढव्य डिजीटल डेटा म्हणजेच ‘बिग डेटा’. पण मग त्याचे एवढे काय विशेष, रिलेशनल डेटाबेस आहे की तो साठवायला, असे वाटणे साहजिकच आहे. पण रिलेशनल डेटाबेसमध्ये साठवली जाणारी माहिती साचेबद्ध (structured) असावी लागते. ती रिलेशनल डेटाबेसमध्ये रो आणि कॉलम्स मध्ये साठवली जाते. माहितीच्या विस्फोटातून तयार होणारा हा ‘बिग डेटा’ unstructured म्हणजेच साचेबद्ध नसतो. तो रिलेशनल डेटाबेसमध्ये साठविणे रिलेशनल डेटाबेसच्या तत्वांनुसार (Principle) पुर्णतः शक्य नाही. त्यामुळे तो बिग डेटा प्रोसेस करणे हे जिकरीचे काम होऊन बसले आहे. पण ह्या ‘बिग डेटा’वरच बर्‍याच कंपन्यांचा धंदा, म्हणजेच रोजीरोटी (Bread and Butter), अवलंबून असल्याने त्यावर उपाय शोधणे अपरिहार्य होऊन ह्या बिग डेटाचा उदोउदो चालू झालेला आहे.

हा अवाढव्य असा बिग डेटा तयार कसा होतो हे तर कळले पण त्याचे प्रोसेसिंग का करायचे? पडला ना प्रश्न! ठीक आहे. आपल्या लाडक्या फेसबुकचेच उदाहरण घेऊयात परत. तुमच्या फेसबुक अकाउंट मध्ये शेकडो मित्र आहेत (नसतील तर आहेत असे समजा Smile ). आता त्या सगळ्यांचेच अपडेट तुम्हाला न्युज फीड मध्ये मिळत नाहीत. तुम्ही कधी असा विचार केलात का की फक्त काही मित्रांचेच फीड तुम्हाला का दिसताहेत? ह्याचे कारण 'बिजनेस इंटेलिजंस'! फेसबुक हा त्याचा बिग डेटा प्रोसेस करुन, त्याचे अ‍ॅनलिसिस (पृथःकरण) करुन त्यातुन तुमच्या उपयोगाची माहिती शोधून काढतो. त्यानुसार तुम्हाला तुमचे 'नविन मित्र बनवा' ह्या सूचना,सजेशन्स आणि जाहिराती फेसबुक दाखवते. लिंक्डइन (Linkdin.com) ही बिजनेस नेटवर्किंग साईटही हा त्या साइटवरचा बिग डेटा अ‍ॅनलिसिस (पृथःकरण) करुन तुम्हाला नविन मित्र, जॉब्स आणि तत्सम बिजनेस रिलेटेड माहिती सजेस्ट करते. त्यामुळे हा बिग डेटा प्रोसेस करून त्याचे पृथःकरण करणे ही आजच्या काळातील अत्यंत निकडीची आणि महत्त्वाची गोष्ट होऊन बसली आहे! हा बिग डेटा प्रोसेस कसा करायचा? हा प्रश्न मार्केटिंगच्या माध्यमातून एकदम निकडीचा बनवून आणि तापवून सर्व मोठ्या मोठ्या कंपन्या त्या तापलेल्या तव्यावर आपापली पोळी भाजून घ्यायचा प्रयत्न करत आहेत.

हा अवाढव्य असा बिग डेटा तयार कसा होतो ते कळले आणि तो प्रोसेस करण्याची निकडही समजली. आता पुढचा प्रॉब्लेम असा की ह्या अवाढव्य बिग डेटाचे प्रोसेसिंग हे नमके कसे करायचे? तो अवाढव्य डेटा प्रोसेस करण्यासाठी सुपरकॉम्प्युटरचीच गरज आहे आणि सुपरकॉम्प्युटर तर सगळ्यांना परडणार नाही, आता? अहो, तुम्ही त्याचे एवढे टेन्शन घेऊ नका. गूगलमधल्या संगणक पंडितांनी त्यावर उपाय शोधला आहे. तो म्हणजे ‘मॅप रेड्युस’ हे तंत्रज्ञान. ‘डिस्ट्रीब्युटेड कंप्युटिंग’ ह्या उच्च तंत्रज्ञानामधली पुढची पायरी म्हणजे हे ‘मॅप रेड्युस’ तंत्रज्ञान. हे संगणकीय प्रोग्रामिंगचे एका मॉडेल आहे जे बिग डेटा ह्या मोठ्या डेटासेट्सचे समांतर (Parallel) आणि विकेंद्रित (Distributed) प्रोसेसिंग शक्य करते. बोजड झाले ना? वोक्के...


चित्र: आंतरजालाहून साभार

समजा तुमच्या संगणकावर तुम्हाला काही आकडेमोड करायची आहे जी पूर्ण व्हायला साधारण 240 तास (म्हणजे 10 दिवस) लागणार आहेत पण त्या आकडेमोडीचा रिपोर्ट तुम्हाला आजपासून पाचव्या दिवशी असणार्‍या बोर्ड मीटिंगमध्ये सादर करायचा आहे. तुमच्याकडे जास्त शक्तीचे, गतिमान असे बरेच नवीन संगणक विकत घेण्याचे बजेटही नाहीयेय आणि वेळही. आता आली का पंचाईत! बोर्ड मीटिंग म्हणजे काही साधे काम नव्हे जिथे काहीतरी थातुरमातुर कारण सांगून वेळ मारून न्यायला. हो, पण जरी ‘बरेच नवीन संगणक’ विकत घेण्याचे बजेट नसले तरीही तुमच्या कंपनीत अगोदरच असलेले शेकडो संगणक आहेत की! त्यातले बरेच आधुनिक संगणक, संगणकातले काहीही कळत नसलेल्या मॅनेजरांकडे आहेत. त्यांची संख्या शेकड्यात असेल. तसेच बाकीचे कारकुनी कामे करण्यासाठी वापरले जाणारे संगणक बर्‍याच वेळा ‘आयडल (idle)’ असतात म्हणजे त्यांची पूर्ण संगणन शक्ती वापरलीच जात नाही. समजा ही वापरात नसलेली त्या संगणकांची संगणनशक्ती तुमची करायची असलेली आकडेमोड करण्यासाठी वापरली तर? तर, नक्कीच तुमचे काम नेमके पाचव्या दिवशी रिपोर्ट सादर करण्यासाठी पूर्ण झालेले असेल.

मॅप रेड्युस हे तंत्रज्ञान नेमके हेच साध्य करण्यास मदत करते. असंख्य सर्व्हर्स (उच्च संगणनशक्ती असलेले संगणक) चे क्लस्टर किंवा farm of servers मध्ये मोठे मोठे डेटा सेट्स (बिग डेटा) एकाच वेळी (parallel) प्रोसेस करणे हे ह्या मॅप रेड्युस तंत्रज्ञानाचे उद्दिष्ट आहे.

तर ह्या माहितीच्या विस्फोटातून तयार होणारा हा अवाढव्य डिजीटल डेटा म्हणजेच ‘बिग डेटा’ आणि तो प्रोसेस करण्यासाठी वापरायची युक्ती म्हणजे मॅप रेड्युस, ही आहे ह्या बिग डेटाच्या बॅन्ड वॅगनच्या मागची पार्श्वभूमी. ह्या बिग डेटाचे मार्केट 2010 मध्ये U$D 3.2 बिलीयन एवढे होते जे 2015 मध्ये U$D 16.9 बिलीयन एवढे होणार आहे. त्यासाठी लागणारे कुशल मनुष्यबळ हा सध्याचा मोठा क्रायसिस आहे त्यामुळे ह्या क्षेत्रात रोजगाराच्या प्रचंड संधी उपलब्ध होत आहेत त्यांचा फायदा आपण करुन घ्यायला हवा!

तर आता हा 'बिग डेटा' म्हणजे काय ते कळले का रे भाऊ?

धाग्याचा प्रकार निवडा: : 
field_vote: 
4
Your rating: None Average: 4 (3 votes)

प्रतिक्रिया

>> फेसबुक हा त्याचा बिग डेटा प्रोसेस करुन, त्याचे अ‍ॅनलिसिस (पृथःकरण) करुन त्यातुन तुमच्या उपयोगाची माहिती शोधून काढतो. <<

त्याबरोबर अशीही शक्यता आहे की फेसबुक किंवा इतर कुणी त्या पृथक्करणातून जी माहिती शोधून काढतं त्यातली काही इतरांच्या उपयोगाची असेल आणि ती माहिती इतरांच्या नजरेला पडणं तुम्हाला पसंत पडणार नाही. उदाहरणार्थ हे पाहा -

Facebook users unwittingly revealing intimate secrets, study finds

Big data: the greater good or invasion of privacy?

  • ‌मार्मिक0
  • माहितीपूर्ण0
  • विनोदी0
  • रोचक0
  • खवचट0
  • अवांतर0
  • निरर्थक0
  • पकाऊ0

- चिंतातुर जंतू Worried
"ही जीवांची इतकी गरदी जगात आहे का रास्त |
भरती मूर्खांचीच होत ना?" "एक तूच होसी ज्यास्त" ||

त्याबरोबर अशीही शक्यता आहे की फेसबुक किंवा इतर कुणी त्या पृथक्करणातून जी माहिती शोधून काढतं त्यातली काही इतरांच्या उपयोगाची असेल आणि ती माहिती इतरांच्या नजरेला पडणं तुम्हाला पसंत पडणार नाही

नक्कीच, त्याबद्दल दुमत अजिबतच नाही. 'वि़ज्ञान - शाप की वरदान' ह्याच न्यायाने बिग डेटाबद्दलही चर्चा करता येईल!
पण ह्या लेखाचा तो उद्देश नव्हता!

- (eसोशल) सोकाजी

  • ‌मार्मिक0
  • माहितीपूर्ण0
  • विनोदी0
  • रोचक0
  • खवचट0
  • अवांतर0
  • निरर्थक0
  • पकाऊ0

सोप्या भाषेत बिग डेटा, ऊत्तम लेख.

बिग डेटाची उपयोजने प्रामुख्याने कृत्रिम(ए.आय)मतीच्या माध्यमातुन उपलब्ध होतील, विना-मनुष्य-चालक चालणारी वाहने(गुगल कार), कृत्रिम पण खर्‍यासारखी वाटणारी संभाषण प्रणाली(अ‍ॅपल सिरि), शरिरातील घडामोडींना रिअल-टाईम प्रतिसाद देणारी अत्याधुनिक मेडिकल उपकरणे(रक्तदाब, मधुमेह इत्यादी मधे उपयोगी), जवळपास माणसासारखे विचार करणारे यंत्रमानव ही काही उदाहरणे बिग डेटाच्या संस्करणामुळे शक्य होणार आहेत, त्यासोबतच युजरच्या समग्र इतिहासाचे संस्करण करुन त्याचे अनेक मार्गाने शोषण करणेही शक्य होणार आहे, स्नोडेनमुळे प्रकशात आलेल्या प्रिझम् किंवा 'बाऊंडलेस इन्फॉर्मंट' हे त्या बिग-डेटाचेच अवतार आहेत.

इतर तांत्रिक प्रगतीच्या फायद्या-तोट्याची परिमाणे बिग डेटालाही लागु पडतात, त्यामुळे हे चांगले अथवा वाईट असले तरी अनिवार्य आहे हे नक्की.

  • ‌मार्मिक0
  • माहितीपूर्ण0
  • विनोदी0
  • रोचक0
  • खवचट0
  • अवांतर0
  • निरर्थक0
  • पकाऊ0

लेख सुंदर झालाय, नेहमीसारखंच छान शब्दांत समजावलय.
बिगडेटाच्या ह्या लेखात 'हडुप' ह्या प्रणालीचा नुसता उल्लेखही आवडला असता Smile
- (हडुपप्रेमी) उपास

  • ‌मार्मिक0
  • माहितीपूर्ण0
  • विनोदी0
  • रोचक0
  • खवचट0
  • अवांतर0
  • निरर्थक0
  • पकाऊ0

- प्रशांत उपासनी

मस्त जमलाय सोकोबा.

फक्त आमचेही मत थोडेसे चिंतूशेटशी मिळते आहे. क्लाउड हा प्रकार खूप 'टॉम टॉमिंग' झालेला असला तरी तो व्यावसायिकांच्या दृष्टीने. वैयक्तिक बाबतीत तो धोकादायकच ठरतो. क्लाउड-सिंक नावाचा जो प्रकार आहे तो आपण बहुतेक सारे स्मार्टफोन वापरणारे कौतुकाने वापरतो. पण या मुळे आपली कॉन्टॅक्ट लिस्ट ही गूगल वा तत्सम व्हेंडरला आयतीच मिळते हे ध्यानात घेत नाही. शिवाय क्लाउड वर हॅकिंग केले की ती आयतीच हॅकरच्या ताब्यात, नि इकडे तुम्हाला पत्ताच नाही. (पीसीवर सिक्युरिटी माझ्या नियंत्रणात असते, काम नसेल तेव्हा बंद ठेवणे हा सर्वोत्तम पर्याय उपलब्ध असतो, इथे क्लाउड वर म्हणजे मोरीला बोळा नि दरवाजा उघडा अशी गत) फेसबुक जसे पैसे घेऊन 'एपीआय' वापरायला परवानगी देते, जेणे करून बिजनेस यूजर्स तुमचा फेसबुक डेटा प्रोग्रमॅटिकली खेचून घेऊ शकतात त्या धर्तीवर 'ग्लोबल डिक्शनरी; वगैरे प्रकार गुगलने आणला तर आश्चर्य वाटू नये. पूर्वी त्रासदायक लोकांना तुमचा फोन नंबर न देण्याचा पर्याय होता, आता साधे गुगलून तो त्याला सहज उपलब्ध होऊ शकेल अशी परिस्थिती आहे. शिवाय तुमच्या स्मार्टफोनवर कोणतेही अ‍ॅप इन्स्टॉल करताना ते अनेक प्रकारचा डेटा अ‍ॅक्सेस करण्याची परवानगी मागते. यात अनेक गोष्टींचा त्या अ‍ॅपच्या कार्याशी काही संबंध नसतो, तरीही आपण तो अ‍ॅक्सेस घाई घाईत त्याला देऊन टाकतो. यात मुख्य धोका तुमच्या कॉल रेकर्डस आणि इन्स्टंट मेसेजेस बॉक्सचा अ‍ॅक्सेस. हा मिळाला की प्रायवसी वगैरे विसरायचेच तुम्ही. इथे शिंचे फेसबुकवर 'मी फक्त अमूक ढमूक लोकांनाच फ्रेंड करून घेतो सिक्युरिटीसाठी' वगैरे म्हणणारे अतिशहाणे लोक स्मार्टफोन गुगल-कनेक्ट ला जोडून देतात तेव्हा तो बिनडोकपणाच म्हणायला हवा. थोडक्यात काय, क्लाउडवर माहिती ठेवणे म्हणजे कुंपण नसलेल्या अंगणात पापड वाळत घालण्यासारखे आहे, कुठून कावळा-कुत्रा येईल नि तोंड लावील सांगता येणार नाही. जे सार्वजनिक नाही, ते तिथे असूच नाही. खासगी गोष्टी खासगी मशीनवरच ठेवाव्यात हे उत्तम.

  • ‌मार्मिक0
  • माहितीपूर्ण0
  • विनोदी0
  • रोचक0
  • खवचट0
  • अवांतर0
  • निरर्थक0
  • पकाऊ0

I think therefore you are wrong!
-Ramata De-scare-de

काल हा धागा आला आणि आज MITच्या Immersion ह्या प्रकल्पाबद्दलचा हा लेख वाचला. जीमेल खातं असेल तर ते वापरून आपण आपला मेटाडेटा आणि त्यावरचं 'बिग डेटा' पृथक्करण पाहू शकाल. तुमच्या फेसबुक वावराचं पृथक्करण करणारं साधन वूलफ्रॅम अल्फाकडून उपलब्ध आहे. लोकांनी ही साधनं वापरून पाहावी. त्यातून निघालेले निष्कर्ष कदाचित 'बिग डेटा'विषयीचे काही रोचक (किंवा भेदक) ज्ञानघोट तुम्हाला पाजतील.

  • ‌मार्मिक0
  • माहितीपूर्ण0
  • विनोदी0
  • रोचक0
  • खवचट0
  • अवांतर0
  • निरर्थक0
  • पकाऊ0

- चिंतातुर जंतू Worried
"ही जीवांची इतकी गरदी जगात आहे का रास्त |
भरती मूर्खांचीच होत ना?" "एक तूच होसी ज्यास्त" ||

आंतरजालावरील खासगी आणि सार्वजनिक संकल्पनांबद्दल विचार करण्याची हीच वेळ आहे. आंतरजालाचे रोजच्या आयुष्यातील स्थान बघता ते आज भारतात थोडेफार टाळण्यासारखे आहे, पण साधारण १० वर्षानंतर आंतरजालाचा वापर हा आजच्या दूरध्वनीच्या वापरासारखाच असणार, रोजच्या आयुष्यातील जवळपास सगळ्याच गोष्टी जोडल्या जातील, अगदी कितीवेळा फ्रिज उघडला किंवा बंद केला -ते- रात्री दिवे किती वेळा बंद-चालू झाले आणि कधी ह्याचा तपशील घराबाहेर सरकार/उपयुक्तता पुरवणार्‍या कंपन्या ह्यांच्याकडे जमा होणार, एकदा घराबाहेर गेल्यावर त्यातलं खासगीपण संपणार. ह्यातल्या बर्‍याचशा गोष्टी जाणिवपूर्वक स्विकारलेल्या असतील तर बर्‍याचशा लादलेल्या असतील आणि हे होणं अनिवार्य आहे, अर्थातच झाकलेलं उघडं पडल्याने काही/बरेचसे फायदे होणार आहेतच, फक्त त्याची किंमत मोजायची तयारी आणि आंतरजालीय वावराबाबत जागृत होण्याची वेळ आली आहे.

प्रगतीच्या ह्या अनिवार्य फळांबद्दल बागुलबुवा तयार करण्यापेक्षा आंतरजालावरच्या वावराबाबत जागृत होणं/करणं अधिक सकारात्मक ठरु शकेल, ह्याचबरोबर भविष्यातील आपत्तीपासुन संरक्षणासाठी सुयोग्य कायदेप्रणालीची गरज भासणार आहे, त्याबद्दल अधिक सर्वंकष विचार होणं गरजेचं आहे.

बिग-डेटाच्या सर्व बाजुंचा तपास घेणारा हा लेख घाबरुन जाऊन डोळे बंद करण्याऐवजी उघडण्यासाठीच मदत करेल असे वाटते.

  • ‌मार्मिक0
  • माहितीपूर्ण0
  • विनोदी0
  • रोचक0
  • खवचट0
  • अवांतर0
  • निरर्थक0
  • पकाऊ0

फारच छान माहिती दिलीत भाऊ.

  • ‌मार्मिक0
  • माहितीपूर्ण0
  • विनोदी0
  • रोचक0
  • खवचट0
  • अवांतर0
  • निरर्थक0
  • पकाऊ0


मधुमेहा विरुद्ध लढा
माझी जालवही