संपादित 3 महीने पहले द्वारा ExtremeHow संपादकीय टीम
आरस्टूडियोसीएसवीएक्सेलएसक्यूएलडेटाबेसडेटा संचालनडेटा विज्ञानविश्लेषिकीउपकरण
अनुवाद अपडेट किया गया 3 महीने पहले
डेटा विश्लेषण के लिए R में आधार होता है, जो एक शक्तिशाली प्रोग्रामिंग भाषा और वातावरण है जो डेटा साइंस में व्यापक रूप से उपयोग की जाती है। RStudio एक इंटीग्रेटेड डेवलपमेंट एनवायरनमेंट (IDE) है जो R के साथ काम करना आसान बनाता है। किसी भी प्रकार का डेटा विश्लेषण करने के लिए, पहले आपको अपने डेटा को R में लाना होता है। कई सामान्य प्रारूप हैं जिनसे आपको डेटा आयात करने की आवश्यकता हो सकती है। तीन सबसे सामान्य प्रारूप CSV फाइलें, Excel स्प्रेडशीट और SQL डेटाबेस हैं। इस लेख में, हम इन स्रोतों से डेटा को RStudio में आयात करने के तरीके का अन्वेषण करेंगे।
CSV, या कोमा सेपरेटेड वैल्यूज़, डेटा संग्रहण के लिए व्यापक रूप से उपयोग किया जाने वाला प्रारूप है। यह एक सरल पाठ प्रारूप है जहां फाइल की प्रत्येक पंक्ति एक डेटा रिकॉर्ड होती है। प्रत्येक रिकॉर्ड में एक या एक से अधिक फ़ील्ड होती हैं, जो कोमा द्वारा अलग की जाती हैं। R की एक शक्ति यह है कि यह आसानी से CSV डेटा को संभाल और प्रक्रिया कर सकता है।
R में CSV डेटा आयात करने का सबसे सरल तरीका read.csv()
फंक्शन का उपयोग है। यह फंक्शन R के बेस पैकेज का हिस्सा है, इसलिए आपको कोई अतिरिक्त लाइब्रेरी स्थापित करने की आवश्यकता नहीं है।
# R में एक CSV फाइल को पढ़ना
data <- read.csv("path/to/your/file.csv")
इस उदाहरण में, "path/to/your/file.csv"
को अपनी CSV फाइल के वास्तविक पथ से बदलें। read.csv()
फंक्शन डिफ़ॉल्ट रूप से फाइल की पहली पंक्ति को एक हेडर के रूप में समझता है, जिसमें कॉलम के नाम होते हैं।
यदि आपकी CSV फाइल में हेडर शामिल नहीं हैं, तो फंक्शन कॉल में आर्ग्युमेंट header=FALSE
जोड़ें:
data <- read.csv("path/to/your/file.csv", header=FALSE)
read.csv()
विभिन्न CSV प्रारूपों को संभालने के लिए विभिन्न अन्य आर्ग्युमेंट प्रदान करता है, जैसे कि sep=";"
का उपयोग करके सेमीकोलोन सेपरेटेड फाइलों के लिए अलग फील्ड सेपरेटर निर्दिष्ट करना।
Reader पैकेज टिडीवर्स का हिस्सा है, जो CSV फाइलों के लिए बेहतर कार्यक्षमता प्रदान करता है। यह फंक्शन तेज़ और उपयोग में अक्सर आसान होते हैं। Reader का उपयोग करने से पहले, आपको पैकेज को स्थापित और लोड करना होगा:
# readr स्थापित और लोड करें
install.packages("readr")
library(readr)
# readr का उपयोग करके CSV फाइल पढ़ना
data <- read_csv("path/to/your/file.csv")
read_csv()
फंक्शन read.csv()
की तरह ही काम करता है, लेकिन विशेष रूप से बड़े डेटा सेट के लिए गति और दक्षता में कुछ सुधार के साथ।
Microsoft Excel एक और लोकप्रिय प्रारूप है जिसमें तालिका डेटा संग्रहीत किया जाता है। Excel डेटा को R में आयात करने के लिए, आप readxl या openxlsx जैसे पैकेजों का उपयोग कर सकते हैं, जिनमें से प्रत्येक अलग-अलग क्षमताएं प्रदान करता है।
Readxl पैकेज R में Excel फाइलों को पढ़ने के लिए एक सुविधाजनक उपकरण है। यह आपके सिस्टम पर Excel इंस्टॉल किए बिना .xls और .xlsx दोनों प्रारूपों का समर्थन करता है।
# readxl स्थापित और लोड करें
install.packages("readxl")
library(readxl)
# एक Excel फाइल पढ़ना
data <- read_excel("path/to/your/file.xlsx")
डिफ़ॉल्ट रूप से, read_excel()
Excel फाइल की पहली शीट पढ़ता है। यदि आपका डेटा किसी अन्य शीट में स्थित है, तो शीट का नाम या उसका इंडेक्स निर्दिष्ट करें:
# नाम से शीट निर्दिष्ट करें
data <- read_excel("path/to/your/file.xlsx", sheet="SheetName")
# इंडेक्स द्वारा शीट निर्दिष्ट करें
data <- read_excel("path/to/your/file.xlsx", sheet=2)
OpenXLSX पैकेज अतिरिक्त कार्यक्षमताएं प्रदान करता है जैसे कि Excel फाइलें लिखना या मौजूदा फाइलों को संशोधित करना। यह Excel फाइल ऑपरेशन के लिए एक और मजबूत विकल्प है।
# openxlsx स्थापित और लोड करें
install.packages("openxlsx")
library(openxlsx)
# एक Excel फाइल पढ़ना
data <- read.xlsx("path/to/your/file.xlsx", sheet = 1)
read.xlsx()
के साथ, आप शीट को उसके नाम या नंबर से निर्दिष्ट करते हैं। यह फॉर्मेटेड डेटा, हैडर, और अन्य को संभालने के लिए विभिन्न आर्ग्युमेंट भी प्रदान करता है।
SQL डेटाबेस का उपयोग व्यापक रूप से दीर्घकालिक, संरचित डेटा संग्रहीत करने के लिए किया जाता है। R में SQL डेटाबेस से डेटा प्राप्त करने के लिए ऐसे पैकेज का उपयोग किया जाता है जो R और डेटाबेस के बीच कनेक्शन बनाते हैं। SQL डेटाबेस के साथ इंटरफेसिंग के लिए दो लोकप्रिय विकल्प RODBC और DBI हैं, जिसमें RSQLite या RMySQL शामिल हैं।
RODBC ओपन डेटाबेस कनेक्टिविटी (ODBC) के जरिए SQL डेटाबेस तक पहुँचने के लिए एक लोकप्रिय पैकेज है। आगे बढ़ने से पहले सुनिश्चित करें कि आपने अपने डेटाबेस के लिए एक ODBC डेटा स्रोत सेटअप कर रखा है।
# RODBC स्थापित और लोड करें
install.packages("RODBC")
library(RODBC)
# डेटाबेस से कनेक्शन स्थापित करें
conn <- odbcConnect("DataSourceName")
# एक SQL क्वेरी निष्पादित करें और डेटा प्राप्त करें
data <- sqlQuery(conn, "SELECT * FROM your_table_name")
# कनेक्शन बंद करें
close(conn)
उपर्युक्त कोड स्निपेट में, "DataSourceName"
को आपके वास्तविक डेटा स्रोत नाम से बदलें और आवश्यकतानुसार SQL क्वेरी में संशोधन करें।
DBI एक डेटाबेस इंटरफेस पैकेज है, जबकि RSQLite SQLite डेटाबेस के लिए कनेक्ट करने के लिए है। ये दोनों मिलकर SQL डेटाबेस को क्वेरी करने के लिए एक शक्तिशाली और लचीला तरीका प्रदान करते हैं।
# आवश्यक पैकेज स्थापित और लोड करें
install.packages("DBI")
install.packages("RSQLite")
library(DBI)
library(RSQLite)
# RSQLite का उपयोग करते हुए कनेक्शन स्थापित करें
con <- dbConnect(RSQLite::SQLite(), dbname="path/to/your/database.sqlite")
# एक SQL क्वेरी निष्पादित करें और डेटा प्राप्त करें
data <- dbGetQuery(con, "SELECT * FROM your_table_name")
# डेटाबेस से डिस्कनेक्ट करें
dbDisconnect(con)
"path/to/your/database.sqlite"
को अपने SQLite डेटाबेस फाइल के पथ से बदलें। इस दृष्टिकोण का अन्य डेटाबेस, जैसे कि MySQL या MariaDB डेटाबेस के लिए RMySQL या RMariaDB के साथ उनके संबंधित पैकेज का उपयोग करके विस्तार किया जा सकता है।
CSV फाइलों, Excel स्प्रेडशीट्स और SQL डेटाबेस जैसे विभिन्न स्रोतों से डेटा को RStudio में आयात करना कई तरीकों से संभव है। इन उपकरणों का उपयोग करके, आप कुशलतापूर्वक डेटा को आयात और हेरफेर कर सकते हैं, इसे R में आगे विश्लेषण और दृश्यीकरण के लिए तैयार कर सकते हैं। इन प्रारूपों से डेटा आयात करने के तरीके को समझना किसी के लिए भी एक मजबूत आधार बनाएगा जो R का उपयोग करते हुए डेटा विश्लेषण या डेटा साइंस में काम करना चाहता है।
यहां चर्चा की गई विधियाँ R में डेटा आयात करने के लिए कुछ सबसे लोकप्रिय और लचीले तरीके दर्शाती हैं। चाहे बेस R फंक्शन्स का उपयोग कर रहे हों या अधिक उन्नत पैकेज जैसे टिडीवर्स का, आप एक विस्तृत श्रेणी की डेटा आयात आवश्यकताओं को आत्मविश्सास से संभालने के लिए सुसज्जित हैं।
यदि आपको लेख की सामग्री में कुछ गलत लगता है, आप कर सकते हैं