विंडोमैकसॉफ्टवेयरसेटिंग्ससुरक्षाउत्पादकतालिनक्सएंड्रॉइडप्रदर्शनकॉन्फ़िगरेशनएप्पल सभी

CSV, Excel और SQL डेटाबेस से डेटा को RStudio में कैसे आयात करें

संपादित 3 महीने पहले द्वारा ExtremeHow संपादकीय टीम

आरस्टूडियोसीएसवीएक्सेलएसक्यूएलडेटाबेसडेटा संचालनडेटा विज्ञानविश्लेषिकीउपकरण

CSV, Excel और SQL डेटाबेस से डेटा को RStudio में कैसे आयात करें

अनुवाद अपडेट किया गया 3 महीने पहले

डेटा विश्लेषण के लिए R में आधार होता है, जो एक शक्तिशाली प्रोग्रामिंग भाषा और वातावरण है जो डेटा साइंस में व्यापक रूप से उपयोग की जाती है। RStudio एक इंटीग्रेटेड डेवलपमेंट एनवायरनमेंट (IDE) है जो R के साथ काम करना आसान बनाता है। किसी भी प्रकार का डेटा विश्लेषण करने के लिए, पहले आपको अपने डेटा को R में लाना होता है। कई सामान्य प्रारूप हैं जिनसे आपको डेटा आयात करने की आवश्यकता हो सकती है। तीन सबसे सामान्य प्रारूप CSV फाइलें, Excel स्प्रेडशीट और SQL डेटाबेस हैं। इस लेख में, हम इन स्रोतों से डेटा को RStudio में आयात करने के तरीके का अन्वेषण करेंगे।

CSV फाइलों से डेटा आयात करना

CSV, या कोमा सेपरेटेड वैल्यूज़, डेटा संग्रहण के लिए व्यापक रूप से उपयोग किया जाने वाला प्रारूप है। यह एक सरल पाठ प्रारूप है जहां फाइल की प्रत्येक पंक्ति एक डेटा रिकॉर्ड होती है। प्रत्येक रिकॉर्ड में एक या एक से अधिक फ़ील्ड होती हैं, जो कोमा द्वारा अलग की जाती हैं। R की एक शक्ति यह है कि यह आसानी से CSV डेटा को संभाल और प्रक्रिया कर सकता है।

बेस R फंक्शन read.csv() का उपयोग करना

R में CSV डेटा आयात करने का सबसे सरल तरीका read.csv() फंक्शन का उपयोग है। यह फंक्शन R के बेस पैकेज का हिस्सा है, इसलिए आपको कोई अतिरिक्त लाइब्रेरी स्थापित करने की आवश्यकता नहीं है।

# R में एक CSV फाइल को पढ़ना
data <- read.csv("path/to/your/file.csv")

इस उदाहरण में, "path/to/your/file.csv" को अपनी CSV फाइल के वास्तविक पथ से बदलें। read.csv() फंक्शन डिफ़ॉल्ट रूप से फाइल की पहली पंक्ति को एक हेडर के रूप में समझता है, जिसमें कॉलम के नाम होते हैं।

यदि आपकी CSV फाइल में हेडर शामिल नहीं हैं, तो फंक्शन कॉल में आर्ग्युमेंट header=FALSE जोड़ें:

data <- read.csv("path/to/your/file.csv", header=FALSE)

read.csv() विभिन्न CSV प्रारूपों को संभालने के लिए विभिन्न अन्य आर्ग्युमेंट प्रदान करता है, जैसे कि sep=";" का उपयोग करके सेमीकोलोन सेपरेटेड फाइलों के लिए अलग फील्ड सेपरेटर निर्दिष्ट करना।

readr पैकेज का उपयोग करना

Reader पैकेज टिडीवर्स का हिस्सा है, जो CSV फाइलों के लिए बेहतर कार्यक्षमता प्रदान करता है। यह फंक्शन तेज़ और उपयोग में अक्सर आसान होते हैं। Reader का उपयोग करने से पहले, आपको पैकेज को स्थापित और लोड करना होगा:

# readr स्थापित और लोड करें
install.packages("readr")
library(readr)

# readr का उपयोग करके CSV फाइल पढ़ना
data <- read_csv("path/to/your/file.csv")

read_csv() फंक्शन read.csv() की तरह ही काम करता है, लेकिन विशेष रूप से बड़े डेटा सेट के लिए गति और दक्षता में कुछ सुधार के साथ।

Excel फाइलों से डेटा आयात करना

Microsoft Excel एक और लोकप्रिय प्रारूप है जिसमें तालिका डेटा संग्रहीत किया जाता है। Excel डेटा को R में आयात करने के लिए, आप readxl या openxlsx जैसे पैकेजों का उपयोग कर सकते हैं, जिनमें से प्रत्येक अलग-अलग क्षमताएं प्रदान करता है।

readxl पैकेज का उपयोग करना

Readxl पैकेज R में Excel फाइलों को पढ़ने के लिए एक सुविधाजनक उपकरण है। यह आपके सिस्टम पर Excel इंस्टॉल किए बिना .xls और .xlsx दोनों प्रारूपों का समर्थन करता है।

# readxl स्थापित और लोड करें
install.packages("readxl")
library(readxl)

# एक Excel फाइल पढ़ना
data <- read_excel("path/to/your/file.xlsx")

डिफ़ॉल्ट रूप से, read_excel() Excel फाइल की पहली शीट पढ़ता है। यदि आपका डेटा किसी अन्य शीट में स्थित है, तो शीट का नाम या उसका इंडेक्स निर्दिष्ट करें:

# नाम से शीट निर्दिष्ट करें
data <- read_excel("path/to/your/file.xlsx", sheet="SheetName")

# इंडेक्स द्वारा शीट निर्दिष्ट करें
data <- read_excel("path/to/your/file.xlsx", sheet=2)

openxlsx पैकेज का उपयोग करना

OpenXLSX पैकेज अतिरिक्त कार्यक्षमताएं प्रदान करता है जैसे कि Excel फाइलें लिखना या मौजूदा फाइलों को संशोधित करना। यह Excel फाइल ऑपरेशन के लिए एक और मजबूत विकल्प है।

# openxlsx स्थापित और लोड करें
install.packages("openxlsx")
library(openxlsx)

# एक Excel फाइल पढ़ना
data <- read.xlsx("path/to/your/file.xlsx", sheet = 1)

read.xlsx() के साथ, आप शीट को उसके नाम या नंबर से निर्दिष्ट करते हैं। यह फॉर्मेटेड डेटा, हैडर, और अन्य को संभालने के लिए विभिन्न आर्ग्युमेंट भी प्रदान करता है।

SQL डेटाबेस से डेटा आयात करना

SQL डेटाबेस का उपयोग व्यापक रूप से दीर्घकालिक, संरचित डेटा संग्रहीत करने के लिए किया जाता है। R में SQL डेटाबेस से डेटा प्राप्त करने के लिए ऐसे पैकेज का उपयोग किया जाता है जो R और डेटाबेस के बीच कनेक्शन बनाते हैं। SQL डेटाबेस के साथ इंटरफेसिंग के लिए दो लोकप्रिय विकल्प RODBC और DBI हैं, जिसमें RSQLite या RMySQL शामिल हैं।

RODBC पैकेज का उपयोग करना

RODBC ओपन डेटाबेस कनेक्टिविटी (ODBC) के जरिए SQL डेटाबेस तक पहुँचने के लिए एक लोकप्रिय पैकेज है। आगे बढ़ने से पहले सुनिश्चित करें कि आपने अपने डेटाबेस के लिए एक ODBC डेटा स्रोत सेटअप कर रखा है।

# RODBC स्थापित और लोड करें
install.packages("RODBC")
library(RODBC)

# डेटाबेस से कनेक्शन स्थापित करें
conn <- odbcConnect("DataSourceName")

# एक SQL क्वेरी निष्पादित करें और डेटा प्राप्त करें
data <- sqlQuery(conn, "SELECT * FROM your_table_name")

# कनेक्शन बंद करें
close(conn)

उपर्युक्त कोड स्निपेट में, "DataSourceName" को आपके वास्तविक डेटा स्रोत नाम से बदलें और आवश्यकतानुसार SQL क्वेरी में संशोधन करें।

DBI और RSQLite पैकेज का उपयोग करना

DBI एक डेटाबेस इंटरफेस पैकेज है, जबकि RSQLite SQLite डेटाबेस के लिए कनेक्ट करने के लिए है। ये दोनों मिलकर SQL डेटाबेस को क्वेरी करने के लिए एक शक्तिशाली और लचीला तरीका प्रदान करते हैं।

# आवश्यक पैकेज स्थापित और लोड करें
install.packages("DBI")
install.packages("RSQLite")
library(DBI)
library(RSQLite)

# RSQLite का उपयोग करते हुए कनेक्शन स्थापित करें
con <- dbConnect(RSQLite::SQLite(), dbname="path/to/your/database.sqlite")

# एक SQL क्वेरी निष्पादित करें और डेटा प्राप्त करें
data <- dbGetQuery(con, "SELECT * FROM your_table_name")

# डेटाबेस से डिस्कनेक्ट करें
dbDisconnect(con)

"path/to/your/database.sqlite" को अपने SQLite डेटाबेस फाइल के पथ से बदलें। इस दृष्टिकोण का अन्य डेटाबेस, जैसे कि MySQL या MariaDB डेटाबेस के लिए RMySQL या RMariaDB के साथ उनके संबंधित पैकेज का उपयोग करके विस्तार किया जा सकता है।

निष्कर्ष

CSV फाइलों, Excel स्प्रेडशीट्स और SQL डेटाबेस जैसे विभिन्न स्रोतों से डेटा को RStudio में आयात करना कई तरीकों से संभव है। इन उपकरणों का उपयोग करके, आप कुशलतापूर्वक डेटा को आयात और हेरफेर कर सकते हैं, इसे R में आगे विश्लेषण और दृश्यीकरण के लिए तैयार कर सकते हैं। इन प्रारूपों से डेटा आयात करने के तरीके को समझना किसी के लिए भी एक मजबूत आधार बनाएगा जो R का उपयोग करते हुए डेटा विश्लेषण या डेटा साइंस में काम करना चाहता है।

यहां चर्चा की गई विधियाँ R में डेटा आयात करने के लिए कुछ सबसे लोकप्रिय और लचीले तरीके दर्शाती हैं। चाहे बेस R फंक्शन्स का उपयोग कर रहे हों या अधिक उन्नत पैकेज जैसे टिडीवर्स का, आप एक विस्तृत श्रेणी की डेटा आयात आवश्यकताओं को आत्मविश्सास से संभालने के लिए सुसज्जित हैं।

यदि आपको लेख की सामग्री में कुछ गलत लगता है, आप कर सकते हैं


टिप्पणियाँ