एखादा डेटा विज्ञान शिकल्याशिवाय यशस्वी बिग डेटा आर्किटेक्ट होऊ शकतो? बिग डेटा आर्किटेक्ट आणि डेटा वैज्ञानिक यांच्यात काय फरक आहे?


उत्तर 1:

एकाधिक A2A साठी धन्यवाद! :)

या प्रकरणात वैयक्तिक अनुभवावर हे माझे हात आहेत.

मिनीक्लिप येथे आमच्याकडे डेटा सायन्स टीम आणि डेटा अभियांत्रिकी कार्यसंघ आहे. डेटा अभियांत्रिकी कार्यसंघ सर्व मोठी डेटा सामग्री हाताळते. कामासह डेटा विज्ञान कार्यसंघ हे करू शकले परंतु आम्ही हे आणखी वाईट आणि हळूवारपणे करू ... आम्हाला ते नको आहे! :)

डेटा अभियांत्रिकी कार्यसंघाला डेटा विज्ञान कार्यसंघ ज्या पद्धतीने जातो त्या विशिष्ट डोमेन ज्ञानात जाण्याची आवश्यकता नाही. तथापि त्यांना बरेचसे मशीन शिक्षण आणि मोठ्या स्वयंचलित डेटा प्रकल्पांमध्ये माहित आहे जे आम्ही एकत्र काम करतो.

म्हणून माझ्या मते, कंपन्या डेटा वैज्ञानिकांवर अवलंबून असलेल्या डोमेन / अल्गोरिथमिक ज्ञानाशिवाय आपण डेटा सायन्सशिवाय एक यशस्वी मोठा डेटा आर्किटेक्ट / अभियंता बनू शकता. आपण त्यात आपले हात तयार केल्यास आपण बरेच चांगले इंजिनियर व्हाल.


उत्तर 2:

मार्सिनशी सहमत. डेटा वैज्ञानिक बिग डेटा आर्किटेक्चरद्वारे बिग डेटा इन्फ्रास्ट्रक्चरचा फायदा घेऊ शकतात. आयएमओ, बिग डेटा आर्किटेक्टला माहित असले पाहिजे अशी काही मुख्य चिन्हे पुढीलपैकी आहेत, त्यापैकी डेटा ticsनालिटिक्स / विज्ञान हा एक भाग आहे (खाली बिंदू 3):

1) डेटा इंजेक्शन - बॅच आणि स्ट्रीमिंग

२) डेटा स्टोरेज - वितरित स्टोरेज, NoSQL

3) प्रक्रिया आणि विश्लेषणे ** - बॅच प्रक्रिया, प्रवाह प्रक्रिया, विश्लेषणे. येथे, बिग डेटा आर्किटेक्टला बिग डेटा इन्फ्रास्ट्रक्चरमध्ये (व्यवसायात वापरण्याच्या बाबतीत आणि डेटा वैज्ञानिकांच्या पसंतीवर आधारित देखील) शिफारस करण्यात आणि त्यामध्ये समाविष्ट करण्यात सक्षम होण्यासाठी उपलब्ध विश्लेषणे साधने / एपीआय बद्दल किमान माहिती असणे आवश्यक आहे. डेटा वैज्ञानिक सक्षम करण्याच्या साधनामध्ये विचारात घेण्यासारखे काही घटक असू शकतात - अल्गोरिदमचे प्रकार उपलब्ध, मूळ भाषा समर्थन, बिग डेटा वातावरणासह कनेक्टिव्हिटी, डेटा पार्सिंग क्षमता, डेटा प्रोफाइलिंग इ.

4) वापर - बॅच किंवा प्रवाह वापर

5) हार्ड डेटा वितरित बिग डेटा वातावरणातील घटकांसाठी आवश्यक आहे

)) बिग डेटा वातावरणाची कार्यात्मक आवश्यकता


उत्तर 3:

मार्सिनशी सहमत. डेटा वैज्ञानिक बिग डेटा आर्किटेक्चरद्वारे बिग डेटा इन्फ्रास्ट्रक्चरचा फायदा घेऊ शकतात. आयएमओ, बिग डेटा आर्किटेक्टला माहित असले पाहिजे अशी काही मुख्य चिन्हे पुढीलपैकी आहेत, त्यापैकी डेटा ticsनालिटिक्स / विज्ञान हा एक भाग आहे (खाली बिंदू 3):

1) डेटा इंजेक्शन - बॅच आणि स्ट्रीमिंग

२) डेटा स्टोरेज - वितरित स्टोरेज, NoSQL

3) प्रक्रिया आणि विश्लेषणे ** - बॅच प्रक्रिया, प्रवाह प्रक्रिया, विश्लेषणे. येथे, बिग डेटा आर्किटेक्टला बिग डेटा इन्फ्रास्ट्रक्चरमध्ये (व्यवसायात वापरण्याच्या बाबतीत आणि डेटा वैज्ञानिकांच्या पसंतीवर आधारित देखील) शिफारस करण्यात आणि त्यामध्ये समाविष्ट करण्यात सक्षम होण्यासाठी उपलब्ध विश्लेषणे साधने / एपीआय बद्दल किमान माहिती असणे आवश्यक आहे. डेटा वैज्ञानिक सक्षम करण्याच्या साधनामध्ये विचारात घेण्यासारखे काही घटक असू शकतात - अल्गोरिदमचे प्रकार उपलब्ध, मूळ भाषा समर्थन, बिग डेटा वातावरणासह कनेक्टिव्हिटी, डेटा पार्सिंग क्षमता, डेटा प्रोफाइलिंग इ.

4) वापर - बॅच किंवा प्रवाह वापर

5) हार्ड डेटा वितरित बिग डेटा वातावरणातील घटकांसाठी आवश्यक आहे

)) बिग डेटा वातावरणाची कार्यात्मक आवश्यकता