विदा-भान - प्रतिसाद
लोकसत्तामध्ये माझं सदर विदा-भान २ जानेवारीपासून सुरू झालं.
विदा म्हणजे काय, ती कशी जमवली जाते, आपल्यासाठी-विरोधात कशी वापरली जाते, याची लोकांना माहिती मिळावी, यासाठी हे सदर आहे. आजूबाजूच्या लोकांशी बोलताना, त्यांना या विषयाची अजिबातच कल्पना नाही, असं वाटलं म्हणून ही लेखमाला.
लेखांचे दुवे इथे चिकटवेनच. त्यावर तुम्हाला काही आक्षेप असतील, चुका काढायच्या असतील, किंवा एखादा महत्त्वाचा मुद्दा आलाच पाहिजे, काही स्पष्टीकरणं फारच उडतउडत लिहिली आहेत, असं वाटत असेल तर जरूर प्रतिसाद द्या. पुढे ५१ आठवडे मी काय लिहिणार, हे अजून पक्कं ठरवलेलं नाही. त्यासाठीही तुमच्या प्रतिसादांचा उपयोग होईल.
अतिशहाणानं या पुस्तकाची खरडफळ्यावर सूचना केली - Data And Reality
विदाविज्ञान, प्रोग्रॅमिंग संदर्भात काही उपयुक्त चर्चा झाली तरीही हरकत नाही. त्याचा नवा धागा काढायची गरज पडली तर तेही करता येईलच.
हा पहिला लेखांक - हा डबा काय साठवतो? (इपेपरचा दुवा.)
लेखांक २ - 'विदा' म्हणजे नक्की काय?
लेखांक ३ - नफ्यासाठी कायपन
लेखांक ४ - वाढदिवसाच्या शुभेच्छा
लेखांक ५ - नजरबंदीचे खेळ..
लेखांक ६ - विदा म्हणजे सांगोवांगी नव्हे
लेखांक ७ - विचारकूपांचे मांडलिक
लेखांक ८ - कूपातील मी मंडूक..
लेखांक ९ - ढासळणाऱ्या तीरावरचे तटस्थ
लेखांक १० - न-नैतिक बघ्यांचे जथे
लेखांक ११ - विदेच्या पलीकडले...
लेखांक १२ - शितावरून भाताची परीक्षा
लेखांक १३ - ..व वैशिष्टयपूर्ण वाक्य
लेखांक १४ - आडातली विषमता पोहऱ्यात
लेखांक १५ - पगडी आणि पगडे
लेखांक १६ - पूर्णातून पूर्ण
लेखांक १७ - तुमच्यासाठी खास!
लेखांक १८ - माहितीपासून ‘हुशारी’कडे..
लेखांक १९ - प्रतिभा आणि प्रतिमा
लेखांक २० - नसतं तसं कसं दिसतं?
लेखांक २१ - चूक, त्रुटी की अन्यायही?
लेखांक २२ - गूगलशी कशाला खोटं बोलू?
लेखांक २३ - नफ्यापुरतीच पाळत
लेखांक २४ - शोधसूत्राची सोय कुणाची?
लेखांक २५ - माहितीपासून पाळतीकडे?
लेखांक २६ - ‘निर्णयवृक्षा’ला माहितीची फळे
लेखांक २७ - प्रारूपांचे ताटवे..
लेखांक २८ - भाकीत चुकणारच; पण..
लेखांक २९ - शिफारस करण्याचा धंदा
लेखांक ३० - बिन ‘आँखों देखी’
लेखांक ३१ - ‘केम्ब्रिज अॅनालिटिका’चं किल्मिष
लेखांक ३२ - खऱ्याची दुनिया नाही, सायेब!
लेखांक ३३- माझ्या दारचं जास्वंद
लेखांक ३४ - सांगोवानगीदाखल..
लेखांक ३५ - दुर्बळांची मुखत्यारी
लेखांक ३६ - आधुनिक विषमतेचे वैषम्य
लेखांक ३७ - दिखावे पे न जाओ
लेखांक ३८ - वादे वादे न जायते गूगललाभ:
लेखांक ३९ - वाटेवरती काचा गं..
लेखांक ४० - गोस्ट हाये पृथिविमोलाची..
लेखांक ४१ - आली लहर.. झाला कहर!
लेखांक ४२ - लोकानुनय की लोकहित?
लेखांक ४३ - विदा मिळाली, पुढे?
लेखांक ४४ - सावध ऐका पुढील टिकटॉक?
लेखांक ४५ - सामाजिकतेचा आलेख सिद्धांत
लेखांक ४६ - डेटा देता एक दिवस बरेच काही मागावे
लेखांक ४८ - विडा उचलताना.
लेखांक ४८ - गोंगाटाचा फायदा कोणाला?
लेखांक ४९ - कृत्रिम प्रज्ञा खरंच बुद्धिवान आहे?
लेखांक ५० - समाजमाध्यमांवरची ‘तण’तण
लेखांक ५१ - सरसकटीकरणाची अटकळ..
लेखांक ५२ - मतांवरची, मनांवरची सत्ता..
प्रतिक्रिया
सुरुवात सोपी व मस्त झालेली
सुरुवात सोपी व मस्त झालेली आहे. हेरगिरीचा हा मुद्दा माहीत नव्हता. पुढिल मालिका वाचायला आवडेल. भरपूर लिही आणि जर वृत्तपत्रिय सदरात कमी शब्दमर्यादा दिलेली असेल तरी सर्व विचार वेगळ्या लेख स्वरुपात ती ऐसीवर मांड. कमेंटमधुन वाचता येते पण खड्यात तांडूळ निवडल्यासारखे करावे लागते. याचा अर्थ ऐसीवर रद्दी कमेंटस असतात असा नसून, कंटेंट, सलग सुसूत्र वाचायची आशा असा आहे.
मराठी भाषा संबंधी कायप्पा वरील काही प्रतिक्रिया
: इंग्रजी Data डेटा या शब्दाला काही जण अलिकडे विदा असा शब्द वापरू लागले आहेत. याला आधारसामग्री हाही शब्द बऱ्याचदा वापरला जातो. कोणता शब्द जास्त समर्पक?
विदा सुटसुटीत वाटला तरी ‘आधारसामग्री’ तून बोध चटकन होतो. तो अर्थपूर्ण आणि समर्पक आहे.
विदा वाल्यांची मांडणी अशी की विद् या संस्कृत धातुवरून विदा शब्द तयार केला आहे. पण हे ओढाताणून केलेलं वाटतंय. आणि आयटीमधल्या नवमराठीजनांची बौद्धिक अरेरावी इतकी असते की आता ह्या अशा शब्दयोजना मुख्य प्रवाहात मान्यता पावतील अशी (भितीयुक्त) लक्षणे आहेत.
विदाला दत्त म्हटलं तर? आपणच दिलेली माहिती. शिवाय वापरायची परवानगी आपणच देतो.
प्रकाश घाटपांडे
http://faljyotishachikitsa.blogspot.in/
!
Given अशा अर्थी 'दत्त' शब्दाची योजना आवडली.
सदराचं नावही 'गुरुदेव दत्त'
सदराचं नावही 'गुरुदेव दत्त' ठेवा.
********
It is better to have questions which don't have answers, than having answers which cannot be questioned.
छान विषय
छान विषय, सुरवात आवडली. केर काढण्याच्या रोबो चे उदाहरण मस्त.
'लोकांना या विषयाची अजिबातच कल्पना नाही' याशी सहमत आहे.
मी एकंदरितच स्मार्ट फोन, ईंटरनेट वापरताना अनावश्यक माहिती देणे टाळण्याचा प्रयत्न करतो. (त्याचा कितपत उपयोग होतो याबाबत साशंक आहेच, तरीही) . माझे मित्र म्हणतात 'तुझी माहिती गोळा करून ते असे काय करणार आहेत'. मी म्हणतो 'माहिती नाही, पण मी सहजासहजी माहिती देणार नाही'.
परवा दुसऱ्या एका शहरात हॉटेल मध्ये चेक इन करताना तेथील कर्मचाऱ्याने बोटाचा ठसा स्कॅन करण्यास सांगितले. (आधार ऑथेंटिफिकेशन असावे बहुतेक ) मी नकार दिला. तेव्हा त्याने पर्याय दिला की शाई लावून ठसा रजिस्टर मधे उमटवा. मला हा ऑफलाईन पर्याय आवडला.
शिर्डी च्या मंदिरात प्रवेश करण्यासाठी पास बनवावा लागतो. तिथेही बोटाचा ठसा स्कॅन करण्यास सांगितले. पर्याय नसल्याने ठसा दिला. मी शिर्डी च्या मंदिरात गेलो होतो ही माझ्यादृष्टिने अनावश्यक माहिती आता इंटरनेटच्या विदागारात कुठेतरी साठवलेली आहे.
हल्ली बरेच आजुबाजुचे लोक अलेक्सा किंवा तत्सम स्पिकर खरेदी करत आहेत. सतत कान देउन ऐकत बसलेला एखादा हेर आपणहून विकत घेताना लोकांना काहीच वाटत नाही.
का मी उगीचच फार विचार करतोय ?
एका चर्चेत निखिल देशपांडे
एका चर्चेत निखिल देशपांडे यांनी मांडलेलं मत मला पटलं. ते म्हणाले, "जोवर साठवलेल्या विद्याचा उपयोग मला साबण विकायला केला जातोय तोवर मला काही फरक पडत नाही. पण जेव्हा त्या विद्याचा उपयोग माझे मूलभूत हक्क दडपण्यासाठी होईल, तेव्हा मात्र मला आक्षेप असेल."
********
It is better to have questions which don't have answers, than having answers which cannot be questioned.
विदासहस्रनाम
सदर प्रतिसाद निरर्थक बकवास वाटू शकेल, पण ते तसं नाही. फार तर मनात आलं ते तसंच्या तसं उतरवून काढलं, असं म्हणता येईल.
सर्वप्रथम, घाटपांडे काकांचे आभार. दत्त हा शब्द मला आवडला/पटला का नाही, याबद्दल एक लेखांक लिहिता येईल. शब्द काही का असेना, त्यातून जे व्यक्त होतंय ते महत्त्वाचं.
बोका आणि आदूबाळनं विषयाला हात घातला आहेच. बोक्यानं हाताच्या ठशांचा उल्लेख केला आहे. ही विदा त्याच्याकडून घेतली, पण तिचा उपयोग नक्की कुठे होईल याबद्दल त्याला (कोणालाच) फार माहिती दिली जात नाही. विदा ही संकल्पना त्रिकोणमिती (trignometry)सारखी निर्लेप नाही. मात्र त्रिकोणमिती ही संकल्पना अनेक शतकं आपल्याला माहीत आहे. कॉलेजात sin, cos वगैरे गोष्टी वापरताना आपण sin = समोरची बाजू / त्रिकोणाचा कर्ण, एवढा विचार करत बसत नाही. कारण तोवर ती संकल्पना आत्मसात झालेली असते.
मात्र विदेचं असं नाही. बोक्यानं म्हटलंय, "मी शिर्डी च्या मंदिरात गेलो होतो ही माझ्यादृष्टिने अनावश्यक माहिती आता इंटरनेटच्या विदागारात कुठेतरी साठवलेली आहे." त्यात आक्षेपार्ह गोष्ट अशी आहे की कदाचित जगाच्या अंतापर्यंत ही माहिती विदागारात साठवली जाईल. आणखी १०० वर्षांनी आपल्यापैकी कोणीही जिवंत नसेल, पण बोक्याच्या नातेवाईक, पोराबाळांना, संबंधितांना या गोष्टीचा त्रास किंवा फायदा होऊ शकेल. पहिल्या भागात माझ्या दृष्टीनं मुख्य मुद्दा हाच होता की हे प्रकरण नवं आहे; त्याच्या उपयोग-उपद्रवाची कल्पना आपल्याला कोणालाच पुरेशी आलेली नाही.
अणूविघटनाचा शोध, E = mc2 याचा शोध लावला तेव्हा त्यातून अणूबाँब बनेल आणि हिरोशिमा-नागासकीत मोठा संहार घडेल याची कल्पना लिझ माईट्नर आणि आईनस्टाईनला नव्हती. पण या गोष्टी घडल्या. मोठ्या प्रमाणात मनुष्यहानी होते तेव्हा त्याविरोधात जनमत सहज तयार होतं. मात्र निखिल देशपांडे - आदूबाळ म्हणतात तसं, आपली राजकीय मतं बदलली गेली ही कदाचित आपल्याला समजणारही नाही. आपली विदा वापरून आपल्याला छाटछूट साबण विकणं निराळं आणि आपलं मतस्वातंत्र्य आपल्या नकळत हिरावून घेणं निराळं.
विदा फक्त दिलीच जाते असं नाही. कधी विदा फक्त असते. आत्ता आमच्याकडे बाहेर ३०से. तापमान आहे, ही विदा आहे. ती दिली-घेतली जात नाहीये. मात्र मी या तापमानाबद्दल प्रतिसाद लिहून ती विदा दिली. तुम्ही जेव्हा हा धागा उघडलात, तेव्हा हा धागा उघडण्याची विदा जमा झाली.
सात आंधळे आणि हत्तीसारखे विदा-विदाविज्ञान या गोष्टी आहेत. विदावैज्ञानिक म्हणून काम करणाऱ्या लोकांना बहुतेकदा 'आम्हाला समजलंय का सुरू आहे ते', असं वाटतं. पण तेही सात आंधळ्यांपैकी एक आहेत. या लेखमालेचं प्रयोजन आहे ते हेच. या हत्तीचं रूप आपल्याला जेव्हा आकळेल तेव्हा आकळेल; तोवर तो हत्ती आपल्याला उपद्रव कसा देतो, याची थोडी माहिती असलेली बरी.
शब्दाबद्दल -
विदा या शब्दाबद्दल मला काहीही राग-लोभ नाही. तो शब्द न्यूरल नेटवर्क्स जशी शिकतात, तसा शिकले. ८-१० वर्षांपूर्वी (माझ्यासाठी प्रथमच) कोणी तरी हा शब्द वापरला, त्याचा अर्थ मला लागला - समजला असं म्हणत नाही - अर्थ लागला म्हणून मी तो पुढे वापरला. न्यूरल नेटवर्कांंबद्दल लिहेन तेव्हा हेच उदाहरण वापरता येईल. त्याबद्दलही आभार. म्हणून चर्चा महत्त्वाची; मतपरिवर्तन झालं तर झालं. सगळ्यांनी एकसारखा विचार केला तर विदाविज्ञानाचाही मला कंटाळा येईल.
माझ्या दृष्टीनं आवाजाच्या संचाला अर्थ प्राप्त होतो कारण तो आपण मान्य करतो. एरवी कोणत्याही आवाजाला, ध्वनिसंचाला अंगभूत असा काहीही अर्थ नाही. मराठी/संस्कृत न जाणणाऱ्या व्यक्तींना विदा हा ध्वनिसंच पूर्णतया निरर्थक वाटेल. मला संस्कृत येत नाही, त्यामुळे विद्वरून विदा आला, ही माहिती माझ्यासाठी फार उपयुक्त नाही; मला या माहितीचं उपयोजन करता येत नाही. विदा हा शब्द स्त्रीलिंगी, त्याचं सामान्यरूप विदे आणि अनेकवचन विदा हेच, ही माहिती मला समजते, या माहितीचा उपयोग करता येतो; कारण ही माहिती मराठी शब्दाबद्दल आहे. मला मराठी येते.
डेट्यासाठी कोणी काय शब्द वापरावेत याबद्दल माझं काहीही मत नाही. अगदी 'भञघूञत' असा काही निरर्थक शब्द योजण्याचं सर्वानुमते(!) ठरलं तर मी तोही शब्द वापरेन. मी भाषातज्ज्ञ नाही, विदावैज्ञानिक/डेटा सायंटिस्ट आहे. शब्द ठरवा, त्याचं लिंग, एक-अनेकवचनं, सामान्यरूप वगैरे काय ते मला सांगा; मी ते शब्द वापरेन. विदा कशी गोळा केली जाते, तिचा आपल्यासाठी आणि आपल्याविरोधात कसा वापर केला जातो याबद्दल लोकांना माहिती असावी, यात मला रस आहे. शिवाय जोडीला डेटासैंटीस्टगिरी करून मला डॉलरं छापता आली की झालं!
वर डेटा या शब्दाचं सामान्यरूप केलं, डेट्या. मग हा शब्द मराठी झाला का? तर माझ्या लेखी हा शब्द मराठी झाला. एक सीडी, अनेक सीड्या; असा प्रयोग केला की सीडी हा शब्द माझ्या लेखी मराठी होतो. मला या वादात खरोखर रस नाही; त्या वादात मत मांडण्यासाठी भाषाशास्त्राचा जितपत अभ्यास पाहिजे, तेवढा माझा अभ्यास नाही. यापुढे तो अभ्यास करायला मला वेळ नाही आणि अभ्यासाशिवाय मतप्रदर्शन करणं मला शक्य नाही.
तरीही व्यक्तिगत आवडीनिवडींच्या पातळीवर विदा हा शब्द मला थोडा आवडतो. विदाविज्ञान यात अनुप्रास साधतो म्हणून नाही; तर मी 'विद्रट' ठरते आणि "मी विद्रटपणा करते", असं म्हणता येतं. हे विनोद वाचवण्यासाठी मी माझं मत विदा या शब्दाच्या पारड्यात टाकेन.
बाकी विदा/डेटा/आत्त/दत्त/सांख्य/डाटा ही एकच संकल्पना आता एवढी महत्त्वाची ठरत आहे आणि ठरणार आहे, की तिला लोक 'आजच्या काळातलं सोनं' म्हणतात. आपण भारतीय लोक तसे धार्मिक, अध्यात्मिक. आपण तिची (संकल्पना) तुलना विष्णूशी करू. विष्णूची कशी सहस्र नावं आहेत, तशी विदेचीही सहस्र नावं. हाच एक शब्द योग्य आणि बाकीचे काहीबाही कारणांनी वाईट, अशी जातीव्यवस्था का तयार करा? आपण विदासहस्रनाम तयार करू.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
अवाका.
ह्या लेखमालेचा अवाका प्रचंड मोठा आहे- तू कसं आणि काय लिहिणार आहेस त्याबद्दल कुतूहल.
.
पण 4 W तरी कळावेत अशी अपेक्षा-
what is data?
how is it collected?
why is it collected?
who can use or misuse it?
हे प्रश्न चढत्या क्रमाने किचकट होत जातात. शेवटच्या प्रश्नाचं उत्तर महा किचकट.
पण बव्हंशी लोकांना "आपल्याच फोन किंवा तत्सम इलेक्ट्रॉनिक उपकरणामुळे आपला विदा आपणच कंपन्यांना पाठवतो" हेच ठाऊक नसतं. आणि हा प्रश्न किती गंभीर आहे तेही.
उदाहरण १- "आणखी ६० वर्षांनी तुम्ही कसे दिसाल?" किंवा "कुठले बॉलीवूड हिरोहिरवीण तुमचे जीवनसाथी बनू शकतात" टाईप भिक्कू ॲपस वापरताना ते ॲप -
तुमचं लोकेशन/काँटॅक्ट/फोटो/कॅमेरा/माईक इ. सगळ्या गोष्टी तपासण्याची मुभा हावरटपणे मागतं.
तुम्ही कत्रिना की ऐश्वर्या ह्या मूलगामी प्रश्नात गुंतले असल्याने बिन्धास्त "I agree" करून मोकळे होता. आणि मग जेव्हा जेव्हा तुम्ही जिथे जाल तिथली माहिती हे भिक्कू ॲप आपल्या कंपनीला पाठवतं.
झिंबल.
उदाहरण २- गूगल जेव्हा अँड्रॉईड फोन सेट करतं, तेव्हा सगळे पर्याय "डिफॉल्ट" तुमचा विदा गोळा करतात. ते न तपासता तसेच ठेवले तर आपली सगळी माहिती सुमडीत गूगलला मिळते. अर्थात ह्यात सुलभता हा भाग आहे, पण बरीच सेटिंग्स (ॲड वगैरे) नीट तपासून पहायला हवी. फेसबुकचंही तेच.
असं अजून बरंच काही. तेव्हा "विदा" जाणणं महत्त्वाचं आहे, इंटरनेटवर वावरताना अजूनच महत्त्वाचं.
लिखाणाला शुभेच्छा!
आणि विदा हा शब्द सोपा आणि उत्तम आहे.
==================
भूतकाळातील आस्वल्य.
4 W
'4 W'बद्दल आभार. माझ्याही डोक्यात असंच काहीसं आहे. पुढची सगळी उदाहरणं वाचून अगदी हेच्च आणि अस्संच्च, अशी प्रतिक्रिया उमटली.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
१) लेख मालिकेचं स्वागत.
१) लेख मालिकेचं स्वागत.
२) छापील माध्यमातले लेख संध्याकाळी केरात/ रद्दीत जातात. पेप्रांचे आर्काइव बरोबर चालत नाहीत त्यामुळे मोठी लेखमालिका असेल तर ते लेख अगोदर ब्लॅागवर टाकून मग पेप्रात द्यावेत ( लोकसत्ताचे मत अनुमती घ्यावी लागेल.)एका ठिकाणी सहज मिळतील.
३) पेप्राचा वाचक वेगवेगळ्या स्तरातला असतो त्यामुळे शैली आणि माहितीबद्दल मत देत नाही.
४)नावातच तारखेचा टॅग असावा -
विदाभान २०१९०१०२
विदाभान २०१९०१०९
विदाभान २०१९०११६
इत्यादि
छापील आणि समाजमाध्यमं
हे होणं शक्य नाही. पण सकाळचा पेपर लोकांच्या हाती पोचल्यानंतर आणि त्यांच्या वेबसाईटवर लेख दिसू लागल्यानंतर एखाद्या लेखकानं तो आपल्या ब्लॉगवर किंवा ऐसीसारख्या साईटवर प्रकाशित केला, तर त्यांना काही अडचण नसावी (कारण आता तो लेख सार्वजनिक आहे).
- चिंतातुर जंतू
"ही जीवांची इतकी गरदी जगात आहे का रास्त |
भरती मूर्खांचीच होत ना?" "एक तूच होसी ज्यास्त" ||
ब्लाग किंवा छापील लेख जे
ब्लाग किंवा छापील लेख जे अगोदर शक्य असेल ते. शोभा डे'चे लेख आणि ब्लागपोस्टही असतात. त्यांचा तसा करार असेल. पण ते एकातएक जोडलेले नसतात. घटनांवर टीका वाच्यता मतं असतात. इकडे एकाच विषयावर मालिका आहे,पुढे कुणाला सलग वाचायची इच्छा होईल तेव्हा पेपराचे अर्काइव फसतील.
.
लोकसत्ताच्या जुन्या लिंका न चालण्याचा अनुभव कोणाला आहे का? युनिकोडपासून मला असा अनुभव नाही.
ब्लाॅगाचा मला कंटाळा येतो, आणखी एक लोढणं कुठे सांभाळणार! त्यापेक्षा सगळं लिहून झाल्यावर, ते साफसूफ करून ऐसीवर डकवणं सोपं असेल.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
संस्कृतिभिन्नता इ.
4W वगैरे ठीक आहे, पण मुळात लोकांच्या मानसिकतेत संस्कृती, सामाजिक स्थान, इ. अनेक घटकांमुळे फरक असतो आणि काळानुसारही पडत असतो ह्याचा विचार होणंही आवश्यक आहे. भारतातल्या लोकांची खाजगीपणाची कल्पना पाश्चात्त्य जगापेक्षा वेगळी असते. कालच मला एक (न-ममव) माणूस एका प्रवासादरम्यान पहिल्यांदा भेटला. तो मला पुन्हा भेटेल ह्याची फारशी शक्यता नाही. त्याचं आडनावही कळलं नसताना पाच मिनिटांत तो सहज स्वतःविषयी इतक्या गोष्टी सांगू लागला की मला आश्चर्य वाटलं. असे तपशील मी अनोळखी माणसाला देत नाही. पण अशा संभाषणात मी स्वतःहून असे तपशील दिले नाहीत तर भारतात मी आखडू ठरतो. अशी माणसं सहज आपला डेटा सगळीकडे (समाजमाध्यमं, ॲप्स, सरकार, इ.) देत राहतात असा माझा अंदाज + अनुभव आहे.
- चिंतातुर जंतू
"ही जीवांची इतकी गरदी जगात आहे का रास्त |
भरती मूर्खांचीच होत ना?" "एक तूच होसी ज्यास्त" ||
अंदाज
सदर इसम वयस्कर किंवा तंत्रज्ञान विषयात नोकरी न करणारा असणार.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
प्रोफाईल
चाळिशीचा असावा. त्याच्याकडे स्मार्टफोन होता, त्यावर व्हॉट्सॅप, इतर ॲप्स होते, आधार होतं, पॅन होतं, इ. इ.
म्हणजे, तो तंत्रकुशल होता आणि त्याचा डेटा त्यानं अनेक ठिकाणी दिलेला असणार (असा माझा अंदाज).
- चिंतातुर जंतू
"ही जीवांची इतकी गरदी जगात आहे का रास्त |
भरती मूर्खांचीच होत ना?" "एक तूच होसी ज्यास्त" ||
आभार.
रोजचा संपर्क बहुतांश विदावैज्ञानिकांशी किंवा त्या कामासाठी सॉफ्टवेअर लिहिणाऱ्या लोकांशी येतो; त्यामुळे त्या पलीकडचे लोक कसा विचार करत असतील, याची सहज कल्पना येत नाही.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
:)
माझ्या वडिलांकडे स्मार्टफोन आहे, त्यावर व्हॉटसअप आहे, इतर अॅपस क्यांडी क्रॅश वगैरे आहेत. आधार ई. आहे. त्यांना तंत्रकुशल म्हणायला मी तयार नाही. मोबाईलच्या मेनुतून डेटा कनेक्शन चुकून बंद झाले तर त्यांना आयडिया किंवा जिओच्या दुकानात जावे लागते.
:D
'ज्याचे हाती ससा, तो फासेपारधी' हा जगाचा न्याय पुरातन आहे.
तद्वत, 'ज्याचे हाती स्मार्टफोन, तो तंत्रकुशल' या आधुनिक न्यायास अनुसरून आपल्या तीर्थरूपांस 'तंत्रकुशल' असे संबोधण्यास प्रत्यवाय नसावा.
अगदी खरं आहे
अगदी खरं आहे
लेखमालेचे स्वागत. सुरुवात
लेखमालेचे स्वागत. सुरुवात उत्तम, बाकी लेखही तसेच असतीलशी अपेक्षा आहे. एकूणच या विषयाची तांत्रिक चौकट सांगताना त्याच्या गणिती-प्रोग्रॅमिंग गाभ्यालाही हात घातला जावा असं वैयक्तिक मत. बाकी लेख येतील तसे पाहूच.
माहिष्मती साम्राज्यं अस्माकं अजेयं
अदिती, आजचा लेख भारी आहे. फार
अदिती, आजचा लेख भारी आहे. फार तोलूनमापून लिहिता आहात असं दिसतंय.
*****************
मेरी मोटी है खाल, लेकीन नाजूक है दिल!!
हाकुना मटाटा!!
*****************
थ्यँक्यू.
आभार, पुंबा.
तोलूनमापून का म्हणता? शब्दाबद्दलच म्हणत असाल तर तो वाद माझ्यासाठी महत्त्वाचा नाही. मला त्यातलं तंत्रज्ञान महत्त्वाचं वाटतं आणि त्याचा आपल्यावर काय परिणाम होतो ते. बाकी वाद साहित्यसंमेलनाची वारी करणाऱ्या लोकांसाठी सोडून देऊ, कसं!
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
नाही. मला succinct ह्या
नाही. मला succinct ह्या अर्थाने म्हणायचे आहे.
*****************
मेरी मोटी है खाल, लेकीन नाजूक है दिल!!
हाकुना मटाटा!!
*****************
Link
इथे लिंक देता येईल का?
.
लेखाच्या मजकुरातच वाढवली आहे.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
दोन्ही लेख
दोन्ही लेख, इथल्या लिंकवरुनच वाचले. आता मला पेपरातले लेख, हात फैलावून वाचण्यापेक्षा, हे सोपं वाटतं! म्हणजे मी वयस्कर या सर्वसाधारण कॅटेगरीतून बाहेर पडलो असा दावा करु शकतो.
सदर इसम वयस्कर किंवा तंत्रज्ञान विषयात नोकरी न करणारा असणार.
हे वाक्य मला उगाचच टोचून गेलं. समोरच्याला, बोलताना अनावश्यक माहिती/विदा पुरवणं, हे माणसाच्या स्वभावावर जास्त अवलंबून असावे, शिवाय ते माणसाच्या आयक्यू शी ही निगडित असावं! प्रवासात याचे अनेक अनुभव आहेत. कुणाला काय सांगावं, याचं भान काही लोकांना उपजतच असतं आणि काहींना ते अजिबात नसतं! त्याचा वयाशी वा तांत्रिक शिक्षणाशी संबंध नसावा.
विदा या शब्दाविषयी उगाचच चर्चा होत आहे. एखादी गोष्ट निरखताना ती उलटसुलट करुन बघतात. तसं, विदा हा शब्द उलट करुन बघितला तरी 'दावि' हा मराठीच शब्द होतो. आपली माहिती इतरांना दाखवणे वा न दाखवणे, या अर्थीही विदा हा शब्दच योग्य आहे.
लेख उत्तम झाले आहेत म्हणून तर माझ्या सारख्या ले मॅनला कळत आहेत. असो.
दोन्ही लेख आवडले.
फेसबुकवर पर्सनॅलिटी टेस्ट किंवा तुम्ही कोणत्या ऍक्ट्रेस सारख्या दिसता किंवा कुठली हेअरस्टाईल तुम्हाला कशी दिसेल वगैरे जे खेळ असतात, त्यातून कोणती विदा कशी वापरली जाऊ शकते ? मोह झाला तरी त्यावाटेला जात नाही.
ही बहुतांशी ॲप्स असतात, आणि
ही बहुतांशी ॲप्स असतात, आणि ती तुम्ही जेव्हा वापरता त्या आधी ती ॲप्स तुमची काय काय माहिती गोळा करताहेत ते विचारतात. तिथे अंदाज येऊ शकतो.
पण पडद्यामागे फेबु काही माहिती ॲप्सना उपलब्ध करून देते- त्यावर एक ग्राहक म्हणून आपला काहीच ताबा नसतो. अशा वेळी ह्या ॲप्सना तुमची काही माहिती फेबुतर्फे मिळू शकते.
थोडक्यात- वाटेला न जाणं हे बेष्ट.
==================
भूतकाळातील आस्वल्य.
अदिती असे वर्गीकरण करता येइल
अदिती असे वर्गीकरण करता येइल का - विदा हा स्टॅटिक व डायनॅमिक असतो.
माझी जन्मतारीख, उंची, अंगावरील तीळ, गुणसूत्रे हा झाला स्टॅटिक विदा.
तर ....
माझे वजन, चित्रपटविषयक आव्डीनिवडी, दरदिवशीचा कॉफी इनटेक, माझी बाजारपेठेतील पत (नेट वर्थ) हा झाला डायनॅमिक विदा.
म्हणजे मला विचारायचे आहे की विदा चे वर्गीकरण मूलभूत किती प्रकारांनी करता येते? तशी काही संकल्पना आहे का?
उंची, अंगावरील तीळ, गुणसूत्रे हा झाला स्टॅटिक विदा.
उंची, अंगावरील तीळ हा डायनॅमिक असावा.
बरोबर!!!
बरोबर!!!
वाचतोय
दुसरा भागही चांगला आहे. मला स्वतःला तो विदा शब्द आवडत नाही. डेटा हा शब्द कुठलंही स्पष्टीकरण ना देता लोकसत्ताच्या वाचकांना सहज कळण्यासारखा आहे. व्याकरणाच्या दृष्टीने विदा पुल्लिंगी की स्त्रीलिंगी? एका ठिकाणी `ती विदा` असा संदर्भ आला आहे. त्याऐवजी डेटा हा साधा शब्द वापरून घोळ सहज टाळता येईल. दत्त वगैरे तर खूपच विनोदी. कॉम्प्रेस केलेला दत्त असेल तर घट्ट म्हणायचं का?
(काहीसे अवांतर)
नाही म्हणजे, आता व्याकरणाचा (आणि तद्जन्य घोळाचा) मुद्दा काढलाच आहेत, तर, डाटा/डेटा हा व्याकरणदृष्ट्या अनेकवचनी आहे. (एकवचन: डाटम/डेटम.) परंतु तरीही, अनेकजण तो (चुकीने) एकवचनी वापरतात. त्या घोळाचे काय करावे?
आम्हांस वाटते, विदा हा शब्द सावरकरी भाषाशुद्धीवाल्यांनी सावरकरांच्याच सन्मानार्थ काढला असावा. (वि.दा. अर्थात, विनायक दामोदर.) अन्यथा, 'डेटा'ला आमचा व्यक्तिशः विरोध नाही. ('बॉम्बे'लासुद्धा.)
हा हा
विदा म्हणजे ते विदा का.
दत्ताख्यान
'काँप्रेस्ड डेटा'बद्दल थोडा विचार करावा लागेल. मात्र, 'रॉ डेटा'करिता 'दत्त दिगंबर' अशी शब्दयोजना करता यावी.
आवरा!
आवरा!
ह्या लेखमालेतील शेवटच्या
लेखाचे शीर्षक अलविदा ठेवणार?
दोन लेख वाचल्यावर असं वाटतय
दोन लेख वाचल्यावर असं वाटतय की बावन लेख (द्यायचेच म्हणून, ) फार होतील. तीनचारनंतर वाचकांचे प्रश्न आले पाहिजेत मग त्यांना उत्तरे असा प्रकार हवाय. किंवा लेखातच काही प्रश्न विचारायचे. त्यांना धरून पुढे जायचे.
.
माझं काम बहुतेकसं विदा साफसूफ करून मॉडेलिंगसाठी तयार करणं आणि मॉडेल मान्य झालं की वेब-डेव्हलपमेंटवाल्या लोकांच्या हातात ते सुपूर्द करणं असं असतं. त्यात विदा कोणत्या प्रकारची आहे - चल किंवा अचल यानं फरक पडत नाही. काही अपवाद असतात, म्हणजे टाईम सिरीज मॉडेलिंग असेल तर अर्थातच फरक पडतो; किंवा भाषेच्या बाबतीतही कधी फरक पडतो.
सामान्यतः व्यक्तींची व्यक्तिगत माहिती जपण्याबद्दल लोक अधिक जागरूक असतात. नाव, जन्मगाव, जन्माची तारीख, वगैरे. मात्र शान्तादुर्गांनी प्रतिसादात जे उदाहरण दिलेलं आहे, "तुम्ही पुढच्या जन्मी कोण होणार" किंवा असले काही प्रश्न फेसबुकवर दिसतात, त्यात दिवसाच्या कोणत्या वेळेला माहिती जमा झाली, याचाही कदाचित वापर करत असतील. भरदिवसा केली तर सदर व्यक्ती बेरोजगार आहे किंवा ऑफिसात आनंदी नाही, असा निष्कर्ष काढता येईल; किंवा असं काही.
विदा वापरून नक्की काय करायचं आहे, कोणता प्रश्न सोडवायचा आहे, यानुसार विभागणी कशी करता येईल याचा विचार केला जातो.
तिरशिंगराव, तुम्ही म्हणता तो मुद्दा व्यक्तिगत पातळीवर योग्यच आहे. असं पाहा की मी कॉलेजात असताना आमच्या घरी फोन आला. आताची कॉलेजातली पोरं मोठी झाली तेच मोबाईल फोन बघत. त्यामुळे नॉर्मल काय आहे, कोणती माहिती महत्त्वाची आणि कशाकडे दुर्लक्ष करता येईल, या गोष्टी स्थलकालपरत्वे बदलत जातात. इमेल पत्ते नसलेले आणि सुस्थित घरांतले पंचविशीचे लोक सापडणार नाही ज्यांचा इमेल अड्रेस नाही, किंवा कोणत्याही समाजमाध्यमांवर नाहीत; वयस्कर लोकांत असे चिकार सापडतील किंवा त्यांचे नावापुरते इमेल अड्रेस असतील आणि समाजमाध्यमं माहीतही नसतील.
घट्ट, दत्त दिगंबर
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
आजच्या लोकसत्तेत विदाभानवर
आजच्या लोकसत्तेत विदाभानवर प्रभाकर नानावटींची प्रतिक्रिया आहे.
प्रकाश घाटपांडे
http://faljyotishachikitsa.blogspot.in/
प्रभाकर नानावटींची प्रतिक्रिया
दुवा इथे
- चिंतातुर जंतू
"ही जीवांची इतकी गरदी जगात आहे का रास्त |
भरती मूर्खांचीच होत ना?" "एक तूच होसी ज्यास्त" ||
नेमका मुद्दा
हळूहळू सर्व्हेलन्स या विषयाकडे वळणं क्रमप्राप्त आहेच. शिवाय नानावटींनी डेटा का विदा असा वाद न घालता इंग्लिश शब्द वापरून, महत्त्वाचा मुद्दा मांडला. हे फारच आवडलंय.
याच विषयावर नंदा खरेंची 'उद्या' ही कादंबरी आहे, जरूर वाचा.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
बायोमेट्रिक काहीतरी असतं ना?
बायोमेट्रिक काहीतरी असतं ना? - Biometric verification is any means by which a person can be uniquely identified by evaluating one or more distinguishing biological traits. Unique identifiers include fingerprints, hand geometry, earlobe geometry, retina and iris patterns, voice waves, DNA, and signatures.
ही परीक्षा तर सिटिझन होताना द्यावीच लागते आहे. शिवाय ऑफिसमध्ये दर वर्षी ही परीक्षा करुन घेणाऱ्यांना, $१०० (गिफ्ट्कार्ड/लिक्विड कॅश वगैरे) ऑफर केले जातात.
टेक्नोमंद
वीकेंडला ज्ञानात पडलेली भर : एक टेक्नोमंद आजीसुद्धा सदर वाचताहेत आणि 'मुलगी चांगलं लिहित्ये' असा अभिप्राय त्यांनी सदरलेखिकेविषयी दिला आहे.
- चिंतातुर जंतू
"ही जीवांची इतकी गरदी जगात आहे का रास्त |
भरती मूर्खांचीच होत ना?" "एक तूच होसी ज्यास्त" ||
मुलगी!
ह्या सदराच्या निमित्तानं आजींनी जर 'मलाही ते फेसबुक किंवा ट्विटर काय असतं ते दाखव' असं म्हटलं तरच माझा उल्लेख 'मुलगी' असा करणं क्षम्य मानेन.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
१) म्हणजे अन्यथा क्षम्य
१) म्हणजे अन्यथा क्षम्य मानणार नाही
२) क्षम्य मानेन पण योग्य मानणार नाही.
आजी असल्या म्हणून काय झालं?
प्रकाश घाटपांडे
http://faljyotishachikitsa.blogspot.in/
आजींचं मत
आजींना अधूनमधून फेसबुकमधलं वेचक-वेधक दाखवलं जातं. कधी कधी एखाद्या विनोदाला आजी हसतात. पण एकुणात तिथे आचरटपणा चालतो, ताज्या प्रत्येक विषयावर लोक हिरिरीनं (पण अनभ्यस्तपणे) व्यक्त होत असतात, आणि ते कंटाळवाणं आहे असं आजींचं मत आहे.
- चिंतातुर जंतू
"ही जीवांची इतकी गरदी जगात आहे का रास्त |
भरती मूर्खांचीच होत ना?" "एक तूच होसी ज्यास्त" ||
आजीबाई...
...कुरसुंदीकरांच्या काय हो?
विद्वान, विदा आणि संवाद
ऑस्टिनात गेल्या आठवड्यात जी महाराष्ट्र परिषद झाली (दुवा), त्यासाठी या विषयात काम करणारे अनेक विद्वान, विदुषी जमले होते. फेसबुकवरचे अनेक मित्रमैत्रिणी तिथे असल्यामुळे मी त्या लोकांना भेटायला म्हणून तिथे जात होते. परिषद संपल्यावर काही लोक बसून गप्पा मारत होते, त्यांत सुहास पळशीकर, राजेश्वरी देशपांडे, शैलेन भांडारे आणि मी बसलो होतो. या लेखमालेचा विषय निघाला.
पळशीकरांनी मला विचारलं, "हा विदा शब्द कुठून आला?"
मी म्हटलं, "८-१० वर्षांपूर्वी 'विदागाराला अपघात' म्हणजे database crash असं वर्णन मी ऐकलं होतं. तेव्हा विदा हा शब्द ऐकला होता, आंतरजालावर."
"आपल्याला कोणाला त्या जगताबद्दल काहीच माहिती नसते", देशपांडे म्हणाल्या. पळशीकरांनी मान डोलावली.
मी पुढे म्हणलं, "मला या विषयातलं काहीही समजत नाही. लोकांनी शब्द वापरला, मी तो पुढे चालवला. शैलेन कदाचित जास्त सांगू शकेल. त्याला संस्कृत येतं."
शैलेन म्हणाला, "हा विषय तिचा आहे. ती जो शब्द वापरेल तो योग्य, असं माझं मत."
मी थोडी जोड लावली, "विद् या संस्कृत धातूपासून विदा हे स्त्रीलिंगी नाम आलं, असं संस्कृत शिकलेल्यानं मला सांगितलं. म्हणून मी तो शब्द तसा वापरते."
हे सगळं पळशीकरांनी शांतपणे ऐकून घेतलं. मग म्हणाले, "नव्या संकल्पनांच्या बाबतीत शब्द कसे येतात याचे तीन प्रकार असतात. एक तर आधीच मराठीत शब्द असतो. नाही तर इंग्लिशमधून जसाच्या तसा वापरला जातो. किंवा संस्कृत-हिंदीमधून येतो."
पुस्तकातली माहिती वाचून दाखवावी, तसं शांतपणे त्यांनी सांगितलं. बास.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
खांडेकरोद्भव
साधारण २००५-०६ च्या सुमारास जेव्हा मराठी ब्लॉगविश्व - किंबहुना एकंदरीतच मराठी आंतरजाल - जेव्हा रांगत होतं; तेव्हा शैलेश खांडेकर ह्या एका ब्लॉगर गृहस्थांनी मनोगतावर (आणि त्यांच्या ब्लॉगवरही) हा शब्द याच व्युत्पत्तीने सुचवला होता. (ओरिगिनल) सर्किटचाचांनी त्याचा जोरदार प्रचार आणि प्रसार केला आणि तत्कालीन मनोगतींच्या जालव्यवहारात तो रुढ झाला.
किंवा संस्कृत-हिंदीमधून येतो.
आणि तो मोस्टली यूजलेस असतो. पिंपरी चिंचवड येथील महानगर पालिकेच्या समोर '(पुण्यश्लोक अहिल्यादेवी होळकर) समतल विलगक आहे' . हे म्हणजे काय ब्वा.
रोड डिव्हायडर?
रोड डिव्हायडर?
ग्रेड सेपरेटर असेल.
ग्रेड सेपरेटर असेल.
आधी रोटी खाएंगे, इंदिरा को जिताएंगे !
+१
बरोबर. पण जर मराठी शब्दाचा अर्थ सांगण्यासाठी इंग्लिश शब्द वापरावे लागत असतील तर हा (तथाकथित) मराठी शब्द वापरण्याचा अट्टाहास किती हास्यास्पद आहे हे लक्षात येते.
आंतरजालावरील चार लोकांशिवाय हा ' विदा ' शब्द कोणाला समजतोय का?
योगायोग!
कर्मधर्मसंयोगाने, 'यूसलेस' हा सर्किटचाचांचा लाडका शब्द होता, हा एक विलक्षण योगायोग.
पळशीकरांनी मला विचारलं, "हा विदा शब्द कुठून आला?"
२००७ मध्ये हा शब्द मी सर्कीट या आयडी कडून उपक्रम वर प्रथम वाचला. त्यावेळी सगळेच मराठी शब्द मला अनोळखी वाटले.
विदा, विदागार, टंकलेखन, परवलीचा शब्द... इ. इ.
लेखमाला वाचतोय...
सर्वच भाग आवडत आहेत.
सर्वच भाग आवडत आहेत.
विषयाचा आवाका थोडा पसरट होत आहे का?
विषयाचा आवाका थोडा पसरट होतो आहे का?
उदाहरणार्थ भाग ३ मध्ये :
मी केवळ विज्ञानक्षेत्रांच्या नावांबाबत आणि सीमारेषांबाबत वाद घालू नये हे योग्य हे जाणून, "पण इथे तात्त्विक फरक आहे" अशा भूमिकेतून लिहितो आहे.
ए-बी टेस्टिंग रँडमाइझ करण्यात डेटा-सायन्स पेक्षा स्टडी डिझाइन, एपिस्टेमॉलॉजी, कॉझल रीझनिंग, वगैरे विचारक्षेत्र आहे.
"रँडमाइझ्ड कंट्रोल्ड ट्रायल" ही पद्धत वापरली, तर त्यातला निष्कर्ष तार्किक दृष्टीने "कारण-कार्य-संबंध" म्हणून ठामपणे सांगता येतो. नाहीतर "हे नुसते कोरिलेशन आहे की कार्य-कारण?" याविषयी ज्ञान संदिग्ध राहाते. ही पद्धत कित्येक दशकांपूर्वी फिशर नावाच्या संख्याशास्त्रज्ञाने शेतकीच्या संशोधनपद्धतींमध्ये आणली होती -- सध्या वैद्यकीय चाचण्यांमध्ये दिसते.
"डेटा सायन्स" अन्य विचारक्षेत्रांच्या संपर्कात येऊन उपयोगी निष्कर्ष काढू शकते, हा मुद्दा ठीकच आहे. पण हे सर्व डेटा सायन्स आहे असे मानण्यात नको इतका मोघमपणा येत आहे. म्हणजे असे : "ए-बी टेस्टींगमधील आकडेसामग्री कार्यकारण भाव सांगू शकते, अन्य काही पद्धतीने मिळवलेली सामग्री मात्र कार्यकारणभाव असल्याचे ठामपणे सांगू शकत नाही" हे तत्त्व कळण्यासाठी हाती कुठलीच आत्तसामग्री लागत नाही, तत्त्वचर्चा पुरेशी असते.
डेटा सायन्सचा आवाका वाढवून "जिथे-जिथे आत्तसामग्री वापरली जाते ते-ते डेटा सायन्सच" असे करू गेल्यास वैद्यक-, खगोल- सर्वच शास्त्रे या आवाक्यात येऊ लागतील. याचा दीर्घगामी तोटा म्हणजे "डेटा सायन्स" हे "सायन्स"शी समानार्थी होऊ लागेल, आणि "डेटा" या विशेषणाला काही विवक्षा राहाणार नाही. तात्पुरता तोटा असा, की या लेखमालेकरिता "अवघे विज्ञान-तत्त्वज्ञान" हे डोईजड होईल, आणि लेख भरकटू शकतील.
--------------------------
पुनर्लेखन
मुद्दे विदाविज्ञानापासून थोडे भटकू शकतात, सावधान!
उदाहरणार्थ भाग ३ मध्ये :
माझी नुसती शब्दांविषयी कुरकुर नाही. अमुक-ओलॉजी तमुक-ओलॉजी नावे नेमकीच वापरा, असे माझे म्हणणे नाही. पण मुळातच काही फरक आहे, त्याने समज चुकू शकते.
लेखात दोन गटांचे रँडमाइझ्ड निरीक्षण करण्याबाबत उल्लेख आहे. रँडमाइझ करण्याचा मुद्दा विदाविज्ञानाच्या बाहेरचा आहे. रँडमाइझ करणे म्हणजे लोकांना यादृच्छिकपणे वेबपेजच्या वेगवेगळ्या रचना दाखवणे. यादृच्छिक असल्यामुळे रचनेला वेगळे काहीच कारण नसते. रँडमाइझ केल्यामुळे हे निश्चितपणे कळते "वेबपेजची एका प्रकारची रचना केली, दुसऱ्या प्रकारची केली नाही या कारणाने लोक फेसबुकवर जास्त वेळ घालवतात. या सँपलमध्ये वेगळे काहीच कारण नाही". कारण निश्चित कळले, तर त्या प्रकारचा बद्ल करता येतो - आणि लोक जास्त वेळ फेसबुक बघतील हे निश्चित असते. रँडमाइझ न करता नुसतेच निरीक्षण केले, तर कारण काय आणि परिणाम काय हे निश्चित सांगता येत नाही. वेबपेजची रचना आणि जास्त वेळ घालवणे या दोघांचे वेगळेच काहीतरी कारण असू शकते. कोणास ठाऊक, एका रचनेतच्या वेबपेजमधला मजकूर जास्त मनोरंजक असेल, ते आपल्याला कसे कळणार. कोणास ठाऊक एक रचना दाखवलेले लोक जास्त कंटाळलेले असतील, ते आपल्याला कसे कळणार? मग रचना बदलली तरी खरे नकळतचे कारण तसेच राहाते. आणि रचना बदलली तरी लोक अधिक वेळ फेसबुक बघतील हे निश्चित नसते.
कारण आणि परिणाम यांचा संबंध निश्चित कसा कळू शकेल? हा प्रश्न तत्त्वज्ञानातला आहे. तो मुळात सोडवण्याकरिता हातात जमवलेला विदा लागत नाही. म्हणून हा मुद्दा विदाविज्ञानाच्या बाहेरचा आहे. रँडमाइझ करण्याची पद्धत फिशर नावाच्या संख्याशात्र्याने शोधून काढली. तो एका कृषिविद्यापीठात संशोधन करायचा. या शोधाला काही दशके झाली. फिशर संख्याशास्त्री असला, तरी रँडमाइझ करणे विदा मिळवण्याच्या खूप आधी -- शेताच्या वेगवेगळ्या भागात बिया पेरताना -- असते. आजकाल रँडमायझेशन नुसते शेतकी संशोधनातच नाही, वैद्यकीय संशोधनातही वापरतात.
वेबपेजच्या रचनेच्या वेळी कारण-परिणामाच्या तत्त्वज्ञानाचा आधार घेते ते विदा विज्ञान आहे, हे खरेच. पण आधाराचे तत्त्वज्ञानही विदाविज्ञानच आहे असे म्हणणे बरोबर नाही. विदा वापरताना जे काही मुद्दे येतात, ते सगळे विदाविज्ञानतलेच असे म्हटले, तर नामुष्की होईल. तत्त्वज्ञान, खगोलशास्त्र, वैद्यकशास्त्र सगळ्यातली तत्त्वे विदाविज्ञानाला सांभाळावी लागतील. आणि शिकणाऱ्याची, समजणाऱ्याची त्रेधातिरपिट उडेल. समज अडेल, असा मोघमपणा टाळायला पाहिजे.
सांपल साईझ
पुरेसा मोठा सांपल साईझ असेल तर या सगळ्या गोष्टींकडे दुर्लक्ष करता येतं. फेसबुकावर तेवढ्या मोठ्या प्रमाणावर सदस्यसंख्या आहे.
विदाविज्ञानात सध्या येणारी मोठी अडचण म्हणजे निरनिराळे लोक निरनिराळ्या संज्ञा वापरतात; कारण वेगवेगळ्या शास्त्रांमध्ये - इथे शेतकी, वैद्यक अशी उदाहरण आली आहेत - सांख्यिकी वापरली जाते त्यामुळे परिभाषा निरनिराळी आहे. आता या सगळ्याला विदाविज्ञान म्हणतात, पण A/B testing हा प्रकार बराच जुना आहे.
मला त्यापुढे मुद्दा मांडायचा आहे की विद्यापीठांमध्ये माणसांवर प्रयोग करतात तेव्हा आधी माहिती देऊन केले जातात. फेसबुकवर असे प्रयोग न सांगता केले जातात. विज्ञान-संशोधन म्हणून हे ठीक आहे, पण आपण त्यात लॅबरॅट्स ठरतो. दुसरा मुद्दा, अनेकदा false negativesचा विचार विदावैज्ञानिक करत नाहीत; ते मोजण्याची, त्याचा फीडबॅक घेण्याची सोयच व्यावसायिक गणितांमध्ये नसते. त्याचे सामाजिक दुष्परिणाम खूप जास्त होऊ शकतात. विशेषतः मार्केटिंगसाठी विदाविज्ञान वापरलं जातं, तिथे तर अनेकदा कमी उत्पन्नाच्या लोकांवर अन्याय होतो, अशी शंका येते.
८५० शब्दांत किती लिहिणार यावर मर्यादा येतात, त्यामुळे फक्त एकच उपमुद्दा या लेखात आला.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
हीच तर चूक आहे
(हे उत्तर प्रामुख्याने शीर्षक आणि पहिल्या वाक्यासंबंधात आहे.)
सँपल साईझ वाढले की सर्व काही स्टॅटिस्टिकली सिग्निफिकंट होते.
(या प्रश्नाचे उत्तर आपणा सर्वांना ठाऊक आहे, पण जणू आपण विदाविश्लेषणाने शोधू बघत आहोत, असे करतो आहे.)
मनुष्यांमध्ये कधीकधी अंगावर एका विवक्षित प्रकारची गुठळी सापडते, कधीकधी सापडत नाही. चढत्या सँपल साईलमध्ये याचा अभ्यास केला, तर असे दिसले :
सँपल साईझ | गुठळ्यांची सरासरी संख्या [९५% रेंज]
4 | 1.5000 [0.5200 ते 2.4800]
8 | 1.2500 [0.5327 ते 1.9673]
16 | 1.1250 [0.6229 ते 1.6271]
32 | 1.0000 [0.6480 ते 1.3520]
64 | 1.0000 [0.7531 ते 1.2469]
128 | 0.9844 [0.8105 ते 1.1583]
256 | 1.0000 [0.8777 ते 1.1223]
512 | 1.0000 [0.9135 ते 1.0865]
1024 | 1.0166 [0.9555 ते 1.0777]
2048 | 1.0176 [0.9744 ते 1.0608]
4096 | 1.0352 [1.0046 ते 1.0657]
8192 | 1.0352 [1.0136 ते 1.0568]
16384 | 1.0313 [1.0160 ते 1.0466]
32768 | 1.0283 [1.0175 ते 1.0391]
65536 | 1.0288 [1.0212 ते 1.0365]
131072 | 1.0211 [1.0158 ते 1.0265]
262144 | 1.0192 [1.0154 ते 1.0230]
524288 | 1.0166 [1.0139 ते 1.0193]
1048576 | 1.0158 [1.0139 ते 1.0177]
तर असे दिसते की साधारणपणे सरासरी मनुष्यांमध्ये १.०१५ गुठळी असते, आणि याबाबत आपला कॉन्फिडन्स अगदी घट्ट आहे (१.०१३९ ते १.०१७७). सँपल साईझ ३२ नंतर खरे तर सरासरी अर्थी-अर्थी बदलली नाही, फक्त आपला कॉन्फिडन्स वाढत गेला. गुठळी ही पूर्णांक असेल, म्हणजे बहुधा बहुतेक मनुष्यांमध्ये १ असेल.
पण (सँपल साईझ 1048576 मध्ये) ०, १, २ गुठळ्यांची टक्केवारी बघितली तर असे दिसते :
० गुठळ्या : ४८.९३%
१ गुठळी : ०.५६%
२ गुठळ्या : ५०.५१%
(या विश्लेषणाचा पॅटर्नही साधारण १०००च्या सँपल साईझ मध्ये स्पष्ट होतो, १० लाख वगैरे सँपल साईझ घेऊन काही वेगळे कळत नाही.
तर असे दिसते की एक गुठळी असणे हे "मध्यवर्ती" असले तरी क्वचितच दिसते! जर या गुठळ्यांच्या प्रभावाबाबत काही माहिती असेल, आणि त्या दृष्टीने काही मार्केटिंग करायचे असेल, तर हे मार्केटिंग सपशेल फसेल! मग हा कसला डोंबलाचा कॉन्फिडन्स!
(या गुठळ्यांची संख्या म्हणजे जांघेत [अंडकोशात] असलेल्या वृषणांची संख्या आहे. यू. एसमध्ये (एका विवक्षित वयाच्या) स्त्रिया साधारण ४८.९ टक्के आहेत, आणि पुरुषांपैकी या वयात साधारण १.१ टक्के व्यक्तींचा एकच वृषण असतो.)
आता तुम्ही म्हणाल, पण "ॲव्हरेज आणि ९५% कॉन्फिडन्स" हेच विदाविश्लेषण आम्ही का म्हणून वापरू? आम्ही सुरुवातीपासूनच ०, १, २ गुठळ्यांची टक्केवारी विश्लेषण म्हणून वापरू. तुम्ही असे म्हणाल तर तुम्हाला हे उदाहरण समजलेले नाही.
विदाविश्लेषणाचे अगणित प्रकार असतात. या उदाहरणात एक सोपा प्रकार चुकलेला आहे, आणि एक सोपा प्रकार अर्थवाही आहे : हे उदाहरण गडदपणे स्पष्ट व्हावे म्हणून आहे. जर "वृषणातील अंडकोषांची संख्या" सारखा सोपा मुद्दा नसेल. फेसबुक वापराबाबतचा आणि आणखी काही व्यक्तिगुण अज्ञात असेल, गुंतागुंतीचा असेल, तर खूप-खूप वेगवेगळी गुंतागुंतीची विश्लेषणे केली जाऊ शकतात. प्रत्येक विश्लेषणाच्या शेवटी काहीतरी निष्कर्ष निघू शकतो. आणि त्या-त्या विश्लेषणाचा तो-तो निष्कर्ष सँपल साईझ वाढला की खूपच कॉन्फिडन्ट वाटू लागतो. जर या सोप्या उदाहरणात दोन सोप्या विश्लेषणामध्ये कमालीचे वेगळे कार्यकारी निष्कर्ष निघू शकतात, तर जिथे वीस-तीस विश्लेषण-पद्धती उपलब्ध आहेत, आणि डेटा स्ट्रक्चर नेमके कुठल्या सैद्धांतिक चौकटीत आहे ते खरेच ठाऊक नाही, तिथे कितीतरी वेगळे "कॉन्फिडन्ट" निष्कर्ष निघू शकतील!
सँपल साईझ बाबत "बायस-व्हेरियन्स ट्रेड-ऑफ" म्हणून एक प्रकार असतो. सँपल साईझ वाढतो, तसा तुमचा व्हेरियन्स (कॉन्फिडन्सचा अभाव) कमी होत जातो (कॉन्फिडन्स वाढत जातो), पण बायस (सत्यापेक्षा वेगळ्या निष्कर्षाची संभवनीयता) वाढत जातो.
---
मी वरील आकडे Stata software simulation वापरून काढले.
हे सॉफ्टवेअर असल्यास पुढीलप्रमाणे तुम्ही हेच आकडे निर्माण करू शकता :
set obs 1048576
set seed 314143
gen randomizer = uniform()
gen num_testes = (randomizer > 0.48917749) + (randomizer > 0.49467749)
foreach i of num 2/20 {
local n = 2^`i'
quietly sum num_testes in 1/`n'
noisily di r(N) " | " %6.4f r(mean) " [" %6.4f r(mean) - 1.96*r(sd)/((r(N))^0.5) " ते " %6.4f r(mean) + 1.96*r(sd)/((r(N))^0.5) "]"
}
tab num_t
रँडम सीड ३१४१४३ अशी घेतली आहे, ते तुमच्या सन्मानार्थ,
समजलं नाही.
या उदाहरणाची फेसबुकानं चालवलेल्या A/B testingशी कशी तुलना करता येईल हे मला समजलं नाही. मुळातच एका गटात सगळे एका प्रकारचे लोक असतात, हे गृहितकच समजलेलं नाही. सांपल साईझ वाढला की बाकीच्या गोष्टी - स्त्री/पुरुष, व्यक्तींची मानसिक अवस्था, दिवसाची वेळ, कामाचं स्वरूप, आणि इतर संबंधित महत्त्वाच्या गोष्टी दोन्ही गटांत समसमान विभागल्या जातील; दोन्ही गटांमध्ये एकच फरक राहिला असं करता येईल, फेसबुकवर काही लोकांना एक फीचर दिसेल, काही लोकांना ते दिसणार नाही.
सांपल साईझमधला "बायस-व्हेरियन्स ट्रेड-ऑफ" हा प्रकारही समजला नाही. तो प्रकार मशीन-लर्निंग मॉडेल्सच्या संदर्भात मी वापरला आहे. पुढचं मराठीत लिहिता येणं कठीण आहे, म्हणून इंग्लिशमध्ये -
A single sample will be high bias but low variance. Combining a lot of high bias samples will drive bias down; then there is chance of high variance, that one would start chasing noise. There are techniques, well implemented will avoid high variance as well. But one cannot get rid of all bias and variance.
---
विदाविज्ञान ज्या प्रकारे वापरलं जात आहे, ते पाहता नीतीशास्त्र, समानता, सामाजिक न्याय, आपलं निर्णयस्वातंत्र्य वगैरे गोष्टी स्वतंत्र म्हणून सोडून देता येणं शक्य नाही. सदर सदर विदाविज्ञान आणि संबंधित तंत्रज्ञानाचा आपल्यावर कसा परिणाम होतो याबद्दल आहे. त्यामुळे बाकीचे विषय सोडून देता येणं शक्य नाही.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
ए-बी टेस्टिंग पेक्षाही सोपी परिस्थिती
ए-बी टेस्टिंग पेक्षाही सोपी परिस्थिती उदाहरण म्हणून घेतली होती.
इतकेच सिद्ध करून दाखवले की सँपल साईझ वाढला तर चुकीच्या मॉडेलच्या निष्कर्षातला कॉन्फिडन्स फाजील वाढतो.
ए-बी टेस्टिंग मधला डेटा वेगवेगळ्या तऱ्हेने विश्लेषित करता येईल, त्याबाबतही काही अर्थवाही, काही अनर्थकारी प्रकार असतील. मोठ्या सँपल साईझमुळे अनर्थकारी प्रकारांत फाजील कॉन्फिडन्स येऊ शकेल.
(ए-बी टेस्टिंग विषयी संदर्भचौकटीचा मुद्दा वेगळ्या प्रतिसादात.)
नीतिशास्त्र वगैरे अनुषंगाने येणार हे ठीकच. यावेच. पण ते-ते मुद्दे स्पष्टपणे त्या अंगाने मांडले तर बरे. म्हणजे वाचकांना नीतीबाबत आधीच धारणा असते, त्याला बिगडेटाचे युग कसा छेद देते. लोकांनी या प्रसंगी नीतीचे भान ठेवले, तर बिगडेटाचा सदुपयोग होऊ शकेल, हा तुमचा अभिप्रेत मुद्दा असावा. पण तो अभिव्यक्तीत व्यस्त होऊ बघतो आहे - लोकांनी डेटाचे भान ठेवले तर नीतिमत्ता साधेल - असे आधीकळसमगपाया व्हायला नको.
(असो. पुरे झाले. लोकांनी काहीतरी भान ठेवायला पाहिजे, हे तुमचे लेख सांगत आहेत ते चांगलेच आहे.)
तुमचा मुद्दा नीतिशास्त्रातला आहे, विदाविज्ञानातला नाही
तुमचा मुद्दा नीतिशास्त्रातला आहे, विदाविज्ञानातला नाहीहे. परंतु लेखनाची शीर्षके जणू काही विदाविज्ञानातली आहेत. ही विदाविज्ञानाची नालस्ती आहे -- नीतिशास्त्र हे या बाबतीत विदाविज्ञानाशी संलग्न पण स्वतंत्र, स्वयंभू आणि प्राचीन आहे : जसे भौतिकशास्त्राचे किंवा रसायनशास्त्राचे नैतिक आणि अनैतिक उपयोग होऊ शकतात, तसे विदाविज्ञानाचे नैतिक आणि अनैतिक उपयोग होऊ शकतात. तुमचा मुद्दा काही प्रमाणात विदाभानाबाबत आहे खरा पण नीतिशास्त्राबाबत अधिक आहे.
पुढे चालू
तत्त्वज्ञान आणि डेटा सायन्स यांच्यात गल्लत केली, तर समज होण्यात काय गल्लत होऊ शकते त्याचे एक उदाहरण :
तत्त्वज्ञानातला एक विचारार्ह मुद्दा म्हणजे The Frame Problem
https://plato.stanford.edu/entries/frame-problem/
थोडक्यात असे, की एखादे कार्यकारी विधान गोलीबंद (काँपॅक्ट) असू शकते. पण ते कार्य नेमके कुठे केले जाऊ शकते, त्या परिस्थितीचा संदर्भ (चौकट, फ्रेम) माहीत नसला, तर ते निरर्थक किंवा अनर्थकारी होऊ शकते.
उदाहरणार्थ : संकेतस्थळाच्या पार्श्वभूमीचा रंग लालभडक ऐवजी फिकट हिरवा ठेवला तर त्याच लेखावरती वाचक अधिक वेळ रेंगाळतात.
आणि या विधानाकरिता आधार म्हणून सर्व आत्त सोबत असेल, समजा.
इथे विधान बऱ्यापैकी परिपूर्ण भासते, पण तरी त्याला संदर्भ नाही.
त्यावर कोण कार्य करेल? आणि काय कार्य होईल? आणि त्या कार्याबाबत हे विधान लागू की गैरलागू? यासाठी बरीच काही संदर्भचौकट लागेल.
हे विधान वाचक जास्तीतजास्त वेळ रेंगाळावा अशा संकेतस्थळचालकासाठी आहे का? (हे पार्श्वभूमीचा रंग फिकट हिरवा ठेवतील किंवा लाल->हिरवा बदलतील.)
थोड्याच वेळात अधिकाधिक माहिती मिळवण्याचा प्रयत्न करणाऱ्या वाचकाकरिता आहे का? (हे वाचक फिकट हिरवी पार्श्वभूमी टाळतील.)
एकाच ठिकाणी रेंगाळाण्याची इच्छा असणाऱ्या वाचकाकरिता आहे का? (हे आपल्या स्थळचालकांना सुचवतील, किंवा न्याहाळकात - ब्राउझरमध्ये - काही रंगबदल करता येईल का पाहातील.)
स्थळचालकाकरिता असेल, तर... ज्या विश्लेषणातून हा निष्कर्ष काढला त्याकरिताचे आत्त सध्याच्या वाचकांकडून आहे (त्यांना राखून ठेवायचे आहे), की जे-सध्या-आपले-वाचक-नाहीत-पण-हवे-आहेत अशा वाचकांच्या कडून आहे?
नवीन वाचक मिळवायचे असतील, तर त्या टार्गेट ऑडियन्सकडून माहिती मिळवण्याचा प्रयत्न करतील.
पार्श्वभूमीच्या रंगाबद्दल विधान काही विवक्षित विषयांवर अवलंबून असल्यास काय? ए-बी टेस्टिंग करताना विवक्षित विषयाच्या पानाची पार्श्वभूमी बदलली होती की वेगवेगळ्या विषयांची?
---
माझ्या विरोधात कोणी म्हणेल की फ्रेम म्हणजे डेटाबाबत डेटा : म्हणजे हे ही सामग्री कुठून मिळवली त्याबाबत डेटा . हासुद्धा डेटाचाच प्रकार की! पण असे नव्हे - हा "फ्रेम = चौकट काय?" प्रश्न डेटाचाच प्रश्न मानत राहिले, तर डेटाबाबत तोच प्रश्न, डेटा-डेटा (मेटाडेटा)बाबत तोच प्रश्न, मेटामेटाडेटाबाबत तोच प्रश्न... हे कधी संपतच नाही. म्हणजे चरम अव्यवस्था (इन्फिनिट रिग्रेस). चौकट/फ्रेम ही डेटामधून कळत नाही, तर तात्त्विकदृष्ट्या डेटाबाहेरील संकल्पना असते.
डेटा->माहिती या प्रवासाकरिता डेटाबाहेरील काही लागते, हे उघडपणे न कळल्याचे तोटे असतात : कुठलीतरी चौकट नकळत, पूर्वी कोणी वापरली असल्यामुळे अध्याहृत होते, आणि कदाचित ती चौकट आपल्या सध्याच्या कामाकरिता चुकीची असेल.
हे मला फारसे काही कळले नाही.
हे मला फारसे काही कळले नाही.
माझ्यापुरते बघायचे झाले तर हे विधान खुपच सरळसोट आहे. भडक रंग डोळ्याला त्रासदायक असल्यामुळे लालच्या ऐवजी हिरवा रंग दिसल्यास वापरकर्ता इरिटेट होण्याची शक्यता कमी होते, त्यामुळे वाचक जास्त वेळ पेजवर रेंगाळतो.
याचा कंटेंटशी काही संबंध असावा असे वाटत नाही..
अर्थात तुमचा मुद्दा पटला आहे, विशेषत: फॉल्स पॉसिटिव्ह बद्दलचा. फक्त उदाहरण तितकेसे मॅच होत नाही असे वाटते.
:-)
लाल पार्श्वभूमी असलेले मराठी संकेतस्थळ लोकप्रिय आहे, येथील काही सभासद तिथेही सभासद आहेत, म्हणून "लाल/फिकट हिरवा" हे उदाहरण दिले. त्या संकेतस्थळावरही कित्येक लोक पडीक असतात, ते विवक्षित लोक या संकेतस्थळावर फारसे येत नाहीत. ते लाल विरुद्ध फिकट हिरव्या पार्श्वभूमीमुळे आहे असे कारण सांगितले, तर बहुधा चूक होईल. बहुधा तेथील मजकूर, नेहमीची मित्रमंडळी, वगैरे, कारणे बलवत्तर असतील. रंगाचा मुद्दा ठरवायला इथेच किंवा तिथेच (किंवा दोन्ही ठिकाणी) रँडमाइझ ए-बी टेस्टिंग करावे लागेल.
मालिका छान चालू आहे.
मालिका छान चालू आहे.
"फेसबुक" आणि "कॅलिफोर्नियातले इंजिनिअर" हे उल्लेख फारच जास्त वेळा येतायत.
--------------------------------------------
ऐसीवरील गमभन इतरांपेक्षा वेगळे आहे.
प्रमाणित करण्यात येते की हा आयडी एमसीपी आहे.
+१
मलाही फेसबुक-बॅशिंगचा कंटाळा यायला लागला. त्यामुळे विषय सर्वसाधारण बायस आणि त्यातून कसा अन्याय होऊ शकतो, याच्या खऱ्या उदाहरणांकडे नेण्याचा प्रयत्न सुरू केला आहे.
त्यावरून प्रश्न - बायस याला मराठीत काय म्हणतात? मोल्सवर्थमध्ये bias शोधल्यावर चांगला शब्द सापडला नाही -
1) वांक or वाक (p. 429) vāṅka or vāka f (वंक S) An ornament for the arm (of females). 2 n A felloe or felly (of a wheel). A rib of a ship or boat. 4 m n Curvature or crookedness, lit. fig., perversion, obliquity, bias: also tortuousness or disingenuousness. 5 Ill-terms, misunderstanding, grudge.
पारिभाषिक कोशात बायससाठी पूर्वग्रह असा शब्द सापडला. तो अर्थाच्या दृष्टीनं जवळचा आहे, पण त्यात हेतूतः बायस असण्याची छटा वाटते. मुळातच बायस असतो, आणि तो जमेल तितपत कमी करावा लागतो, अशा अर्थाचा शब्द हवा आहे; ज्यात हेतू असल्याचं सुचवलं जाणार नाही.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
...
'पूर्वग्रह' हा अगदी चपखल प्रतिशब्द नाही खरा, परंतु पूर्वग्रहात हेतूची छटा का बरे जाणवते?
पूर्वग्रह हे हेतुतःच असले पाहिजेत, हे (निदान मला तरी) आवश्यक वाटत नाही. (चूभूद्याघ्या.)
(ता.क.: कदाचित 'पूर्वग्रह' आणि 'पक्षपात' यांच्यात आपला गोंधळ होत असावा काय? उत्तरोक्त हा निश्चितपणे हेतुपुरस्सर असावा, असे वाटते. (पुनश्च चूभूद्याघ्या.))
पूर्वग्रह/पूर्वग्रहदूषित हे
पूर्वग्रह/पूर्वग्रहदूषित हे शब्द मला तरी योग्य वाटताहेत.
लेखमालेचे शीर्षक विदाभान अणि
लेखमालेचे शीर्षक विदाभान अणि सामाजिक माध्यमे असे थेवायल हवे असे वाटतेय.
बाकी वाचतोय अनि आवडतेय हेवेसानल.
+१
असेच म्हणतो.
बायस
सध्या सामाजिक माध्यमांकडे कल आहे, खरा. पण ते हळूहळू त्यापुढे माझ्या समव्यावसायिकांच्या 'पापां'कडेही वळवायचं आहे.
(इतरत्र केलेला फालतू विनोद सोडवत नाही - कल हो ना हो...)
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
वाचायची उत्सुकता आहे.
वाचायची उत्सुकता आहे.
उत्तर
वर फेसबुकवरून भूषण पानसे यांनी विचारलं आहे -
कायदा म्हणून गूगल आत्महत्या कशी करावी याचे सल्ले देऊ शकत नसावं. नैतिकता म्हणूनही मला असा कायदा आणि गूगलचं वर्तन मान्य होतं. इच्छामरण वा दयामरण निराळं; त्यामध्ये बरेच जबाबदार लोक, कायदा वगैरे गोष्टी अंतर्भूत होतात.
गूगल 'अमकी गोष्ट तुमच्या आवाक्याबाहेरची आहे' असं सांगणार नाही. तसं सांगितलं तरीही एक वेळ (!) ठीक आहे. ते चापलूसपणे तुम्हाला परवडतील अशा स्वस्त गाड्यांच्या जाहिराती शेजारी लावतील. असं काही सुरू आहे, हे आपल्याला समजतही नाही. शिवाय एकदा गरीब असा शिक्का बसला की त्यातून प्रत्यक्षात बाहेर येणं कठीण असतं. विदाविज्ञान हे अस्तित्वात असलेले पॅटर्न्स पुढे चालवतं. त्यामुळे गरीबांवर या प्रकरणात आणखी अन्याय होण्याची शक्यता असते. गरीबच नाही, स्त्रिया, कृष्णवर्णीय, दलित, मागासवर्ग, असे गरीब वा अल्पसंख्य समजले जाणारे सगळेच गट.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
माझा एक "हाटे" नावाचा मित्र
माझा एक "हाटे" नावाचा मित्र आहे. फेसबुक त्याला "एच ए टी ई" असा आयडी घेऊ देत नाही.
--------------------------------------------
ऐसीवरील गमभन इतरांपेक्षा वेगळे आहे.
प्रमाणित करण्यात येते की हा आयडी एमसीपी आहे.
ई वरती तिरकी रेष असेल तर ए
ई वरती तिरकी रेष असेल तर ए असा उच्चार आहे हे स्पेसिफाय होते. तसे घेऊन करता येत असावे, उदा. चिन्मय दामले याञ्ची प्रोफाईल.
माहिष्मती साम्राज्यं अस्माकं अजेयं
...
तसेच, ए वर आडवी रेष असल्यास त्याचा उच्चार आ हेही स्पेसिफाय होत असावे.
पण हे कळफलक वापरून टंकणे हे अशक्य जरी नसले, तरी महाकिचकट आहे हो! म्हणजे, विचार करून पाहा, थत्तेचाचांच्या प्रस्तुत सन्मित्रास फेसबुकी लॉगिन होताना प्रत्येक खेपेस जर ए आणि ई टंकताना अशी सर्कस करावी लागली, तर तो प्रथम कोणास हेट करू लागेल, स्वतःच्या आडनावाला, की फेसबुकाला?
एकदा गरीब असा शिक्का बसला की
एट्टो नॉय चॉलबे! हे बरोबर नाही. अजाइल मेथडॉलॉजी प्रमाणे, सातत्याने रेट्रोस्पेकटिव्ह व (गरज भासल्यास) दिशाबदल करत रहाणे आवश्यक आहे जे की विदाविद्न्यालनाला आत्तातरी शक्य नाही असे तुझ्या कमेंटवरुन वाटते.
जे निरागसांचे नैरागस्य ...
सॉफ्टवेअर आणि विदाविज्ञान यांत जमीन-अस्मानाचा फरक आहे.
विदाविज्ञान आता फार चलनात आहे याची दोन कारणं - १. विदा जमा करणं, किंवा तयार करणारी साधनं सहज उपलब्ध आहेत. आणि २. त्यातून नफा कमावता येणं शक्य आहे.
गरीबांना गरीबीत ठेवून, बायकांना कमी पगाराच्या नोकऱ्या दाखवून, किंवा कृष्णवर्णीय लोकांच्या फोटोंचं वर्गीकरण 'गोरिला' असं करूनही जर नफा वाढत असेल तर व्यावसायिकांना त्यातून वाढणाऱ्या असमानतेचं काहीही पडलेलं नसतं. विशेषतः छोट्या, मध्यम आकाराच्या कंपन्यांना. त्यांच्याबद्दल फार कोणी बोलत नाही, त्यांचे चाळे दुर्लक्षित राहतात. 'केंब्रिज अनालिटिका' हे त्याचं झगझगीत उदाहरण. कोणाला माहीत होतं यांचे काय चाळे सुरू आहेत ते, २०१६च्या अमेरिकी निवडणुका होईस्तोवर! फेसबुकच्या नाकाखाली सगळे उद्योग करून झाले.
गूगल, फेसबुक, ट्विटर वगैरे मोठ्या कंपन्यांचे चाळे नजरेसमोर येतात आणि त्याबद्दल लोक बोलतात. मग प्रतिमा जपण्यासाठी का होईना, या लोकांना काही करावं लागतं. ते जे काही करतात, ते विनोदी नसेलच असं नाही - एक उदाहरण वर थत्तेंनी दिलेलं आहेच, हाटे नावाच्या माणसाला त्यांचं आडनाव मराठी पद्धतीनं इंग्लिशमध्ये लिहू न देणं, वगैरे. पण निदान त्यांचा हेतू स्वच्छ असल्याचं दिसतं. हाटे नावाच्या माणसांना त्यांना हवं तसं स्पेलिंग करता यावं म्हणून हजारो मराठी लोकांनी फेसबुक सोडल्याची बातमी होऊ दे, फेसबुक त्यात खर्च करून, योग्य माणसांकडून योग्य विदा जमा करेल; त्यातून विदाविज्ञानातून आलेले निकाल बदलतील. नफा घटत नाही आणि कंपनीची प्रतिमा डागाळत नाही तोवर हे असंच चालू राहणार.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
फेकन्यूजची टूथपेस्ट बाहेर आलेली आहे.
काल मी 'केंब्रिज अनालिटिका'च्या नावानं अनेक ठिकाणी शंख केला, इथे, इमेल्स, फोन संवादांत, वगैरे.
आज ही बातमी वाचली -
New AI fake text generator may be too dangerous to release, say creators
इलॉन मस्क आणि इतर काही व्यावसायिकांनी पैसा पुरवून हे संशोधन करवून घेतलं. यातून खोटं लेखन तयार करता येतं. दोन परिच्छेद दिल्यावर त्या बॉटनं खरा वाटेल असा मजकूर तयार केला. त्याचं एक उदाहरण या बातमीत आहे. आत्तापर्यंत लोक रँडम शब्द एकमेकांसमोर जोडत होते, ते मनुष्यानं वाचलं की 'काही तरी गडबड आहे' हे समजत होतं.
सध्या हे संशोधक हे संशोधन प्रकाशित करायला तयार नाहीत. पण ही टूथपेस्ट ट्यूबमधून बाहेर आली आहे. एका गटानं हे संशोधन केलं आणि झाकून ठेवलं म्हणून दुसरा गट करू शकणार नाही, असं अजिबातच नाही. याचं विदाविज्ञानातलं प्रसिद्ध उदाहरण म्हणजे नेटफ्लिक्सची सुचवणी-यंत्रणा (recommender system). नेटफ्लिक्सनं २००६ सालात असं आव्हान दिलं की नेटफ्लिक्स आपल्याला सिनेमांची सूचना करतं, त्याची
अॅक्यूरसी (मराठी?)अचूकता साधारण १०% होती. ती एका वर्षात १०%नं वाढवणाऱ्यांना, म्हणजे ११%पर्यंत करून दाखवणाऱ्यांना काही लाख डॉलर्सचा पुरस्कार मिळेल.तर पहिल्या वर्षात कोणीच त्या पातळीवर पोहोचू शकले नाहीत, पण काही सुधारणा झाली. त्यांतल्या तीन गटांना नेटफ्लिक्सनं काही पैसे दिले. त्यानंतर काही (बहुतेक चौथ्या वर्षी) वर्षांनी एका गटाला ६% जास्त (१०%पेक्षा कमी पण आधीपेक्षा खूप) चांगले निकाल मिळाले. विचार करा, तीन वर्षं आणि काही महिने उलटून गेले आणि उत्तर मिळालं. इतर दोन गटांना त्यानंतर काही मिनीटांत साधारण तेवढेच चांगले, ७ आणि ८ टक्के, निकाल मिळाले. या तीन गटांमधली लोकं आपले गट बदलूनही एकत्र काम करत होती.
पण मुद्दा असा की मायक्रोफोनचा शोध मार्कोनी आणि बोस दोघांनीही साधारण एकाच सुमारास लावला. ऑर्कुट, गूगल+, मायस्पेस, फेसबुक वगैरे गोष्टी काही वर्षांच्या अंतरानं आल्या. आजही फेक न्यूज सहज पसरतात, "नाही, महत्त्वाचं वाटलं म्हणून पुढे पाठवलं" असं लोक निरागसपणे म्हणतात. छापलेल्या शब्दांवर विश्वास ठेवायचा, तसाच व्हॉट्सॅप विद्यापीठावरच्या गोंधळावर विश्वास ठेवतात. कृत्रिम बुद्धीमत्ता वापरून खोट्या बातम्या बनवता येणार असतील तर नक्की विश्वास कशावर आणि कसा ठेवायचा, असे मूलभूत प्रश्न उभे राहतात.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
अजुन एक विरोधी मताची
अजुन एक विरोधी मताची विचारधारा नव्याने पुढे येते आहे - की कमी विदा आर्टिफिशिअल इन्टेलिजन्स करता अधिक फायद्याचा असेल
(https://hbr.org/2019/01/the-future-of-ai-will-be-about-less-data-not-more,
https://towardsdatascience.com/why-small-data-is-the-future-of-ai-cb7d70...,
https://www.canadianunderwriter.ca/insurance/why-future-ai-will-involve-... ,
https://www.gsb.stanford.edu/insights/surprising-power-small-data)
ते का कोणास ठाउक?
मला ते लेख किचकट वाटले.
_______________________
वरील मुद्दा सांगण्यात, विषयाला वेगळं वळण देण्याचा किंवा फाटे फोडण्याचा हेतू नाही. तुझा विषय - बिग डेटा नसून 'विदा (डेटाटासायन्स)' हा आहे म्हणुन मुद्दा मांडला. मला वाटलं तो रिलेव्हंट (सुसंगत) आहे.
फुगा
तांत्रिकदृष्ट्या ज्याला बिग डेटा म्हणतात, त्यावर मी काम केलेलं नाही. मला त्याचं तंत्र अज्ञाप अवगतही नाही.
माझ्यासारख्या लोकांचं काम विदा किती आहे, यामुळे फारसं बदलत नाही. किंबहुना 'एवढ्या प्रमाणात संगणकीय शक्ती वापरण्याची गरज नाही, आधी बारके प्रयोग करून बघू' असं शहाणपण असलेल्या विदावैज्ञानिकांची गरज अधिक आहे; वरचे काही लेख चाळले, ते हे न समजणाऱ्या लोकांसाठी लिहिल्यासारखे वाटले. 'बिग डेटा' हा विदाविज्ञानातला फुगा आहे, मुळात विदाविज्ञान हा सुद्धा काही अंशी फुगाच आहे, असं माझं मत झालं आहे.
फुगा म्हणजे उगाच आलेला फुगवटा म्हणा किंवा लहान मुलांना आकर्षक वाटणारी वस्तू म्हणा. दोन्ही अर्थांनी.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
मार्मिक श्रेणी द्यायचा
मार्मिक श्रेणी द्यायचा प्रयत्न करतोय.
खरे तर बिग डाटा म्हणजे आलेल्या प्रचंड डेटा मधून कामाचा डेटा गोळा करण्याचे तंत्रद्न्यान आहे. जो नंतर डेटा सायंटिस्ट वगैरे वापरतात. किंवा अन्य कोणी देखील वापरू शकते.
किंवा डेटा सायंटिस्ट ने दिलेले पॅटर्न घेउन डेटा शोधणे हे दुसरे काम आहे.
दोन्ही एकमेकांना पूरक असावेत.
इसलिये हम कहते है की विदाही
इसलिये हम कहते है की विदाही भगवान है|
प्रकाश घाटपांडे
http://faljyotishachikitsa.blogspot.in/
लेखांक १० फार आवडला.
लेखांक १० फार आवडला. विविध उदाहरणांद्वारे मुद्दे पटवून दिले आहेत. रिसर्च व त्यावरील चिंतन कळते आहे.
संशोधन निराळं.
हा लेख म्हणजे ऐसीवर दिलेल्या प्रतिसादाचा विस्तार आहे. मात्र त्यात संशोधन नाही; ते निराळं.
अनेकांनी खाजगीत 'ब्लॅक मिरर'चा उल्लेख नाही, अशी प्रतिक्रिया दिली. (त्या मालिकेसमोर माझं लेखन अगदीच पांचट वाटलं आणि शब्दमर्यादाही आड येते.) पुढे कधी तरी लेखमालेतच 'Black Mirror', 'Her', 'Ex Machina' आणि 'उद्या' या मालिका, चित्रपट आणि कादंबरीबद्दल स्वतंत्र लिहावं असा विचार करत आहे. विदा, विदाविज्ञान आणि या तंत्रज्ञनाचा आपल्यावर होणारा परिणाम याबद्दल बरेच लोक बरंच काही म्हणत असतात; एवढा माफक मुद्दा पसरला तरी उत्तम.
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
मी ज्याला संशोधन म्हणते तो
मी ज्याला संशोधन म्हणते तो कदाचित तुझा स्टेपल खादाडीचा भाग असावा, जसे चीन मधील परिस्थिती मला वाटलं तू संशोधन केल्यावर तुला सापडली असेल पण कदाचित तसे नसेलही तुझ्या नेहमीच्या रुटिन बातमी-वाचनात तो भाग येउन गेला असेल.
सी सी कॅमेरे, चीन असे बरेच बरेच मुद्दे मस्त आहेत. आवडलेच.
खरं संशोधन निराळं.
आपल्यापुरती समजते ती नवीन माहिती; जगात आतापर्यंत कोणालाच माहीत नसलेली गोष्ट प्रथमच उजेडात येते, ते संशोधन. मात्र बोलताना बहुतेकदा संशोधन किंवा research हे शब्द तेवढ्या काटेकोरपणे वापरले जात नाहीत.
(ती चीनची विवक्षित बातमी माझ्या 'एको चेंबर'मधून मला किमान दोनदा मिळाल्याचं आठवत आहे - फेसबुक फीड आणि एका मित्रानं दुवा पाठवला.)
---
सांगोवांगीच्या गोष्टी म्हणजे विदा नव्हे.
पाने