Cum Să Instalezi Pachete în R Folosind Consola

În aceast tutorial, am sa îti arat cum să instalezi pachete în R pas cu pas, folosind depozitele CRAN ale R, dar și via GitHub.

Sintaxa comenzii pentru instalarea pachetelor R este install.packages(), și mai jos vom descoperi exact cum să o utilizăm.

De asemenea, vom examina modul în care funcționează gestionarea pachetelor în R, vom instala și gestiona oglinzile CRAN, precum și mascarea pachetelor pentru situațiile în care două pachete folosesc același nume de funcție. Și dacă învățăm să instalăm pachete R din consola, ar trebui să învățăm și cum să le dezinstalăm, nu-i așa?

Nu vom acoperi instalarea R și RStudio pe computerul dumneavoastră, deoarece presupun că deja ați făcut asta. Totuși, dacă nu, puteți urma ghidul din linkul de mai sus și să aveți R și RStudio funcționale pe sistemul dumneavoastră de operare înainte de a continua cu acest ghid.

Dar mai întâi, să clarificăm câteva aspecte legate de pachetele R.

Cum să gestionezi pachetele în R

Pe scurt, un pachet R constă dintr-o serie de funcții R, cum ar fi seturi de date, fișiere suport și cod compilat, ambalate într-o manieră compactă și bine definită.

În esență, aceste pachete sunt doar fișiere comprimate care trebuie dezarhivate și plasate în locația potrivită pe calculatorul tău înainte de a le putea utiliza în R.

Tot acest proces se întâmplă automat și nu necesită intervenția utilizatorului. Pe lângă software, fișierul de instalare al R include aproximativ 30 de pachete implicite sau recomandate, dintre care aproximativ șapte sunt încărcate în memorie imediat ce R este lansat.

Aceste pachete sunt montate într-un dosar desemnat pe computerul tău și sunt utilizate pentru o gamă largă de sarcini de calcul, cum ar fi gestionarea datelor și analiza statistică.

Cu toate acestea, deoarece R este un limbaj de programare open-source, există multe pachete contribuite de utilizatori disponibile pentru diverse scopuri și sunt accesibile public oricui.

Aceste pachete pot fi accesate de pe site-ul CRAN sau direct din depozitele R. Segmentul următor oferă mai multe detalii despre cum să descarci și să instalezi pachetele contribuite de utilizatori în R.

Lansează R și execută următoarea comandă în consola R:

search()

Și rezultatul:

Rezultatul comenzii search () în R. Sursa: uedufy.com
Rezultatul comenzii search () în R

Rezultatul de mai sus afișează o colecție de elemente din calea de căutare. Numerele din paranteze pătrate arată indexul pozițional al unității imediat la dreapta, de exemplu, numărul [5] indică că al cincilea element din listă este respectiv pachetul grDevices.

Poți observa că nu toate pachetele au un număr de poziție [x] atribuit, dar atâta timp cât poți număra, poți determina singur poziția respectivă.

Ieșirea de mai sus poate apărea ușor diferită pe sistemul tău R. De exemplu, pe diferite afișaje, fereastra consolei R va fi dimensionată automat pentru a se potrivi cu rezoluția suportată, în special în ceea ce privește lățimea, și ca rezultat, consola R va fi scalată pentru a se potrivi.

Un alt motiv ar putea fi că ai alte pachete încărcate în sistem, fie pentru că le-ai instalat tu însuți, fie pentru că echipa R a inclus (sau eliminat) pachete regulate în versiunile mai noi ale R.

În continuare, să examinăm unele dintre cele mai importante opțiuni în comanda de ieșire search() prezentată mai sus:

Intrarea GlobalEnv este adesea localizată în prima poziție [1] a rutei de căutare și nu este un pachet R. GlobalEnv reprezintă Mediul Global și este locul unde obiectele R nou create sunt plasate în memorie.

Obiectul package:base este întotdeauna poziționat la sfârșit și, spre deosebire de alte pachete, package:base nu poate fi eliminat.

Dacă folosești RStudio, vei vedea o intrare suplimentară aici, respectiv tools:rstudio, în plus față de ieșirea de mai sus.

Amintiți-vă că am menționat mai sus că cele 30 de pachete R implicite nu sunt toate încărcate în memorie când R este lansat. Poți folosi funcția library în R pentru a încărca oricare dintre aceste pachete sau orice alt pachet instalat, dar încă neîncărcat în memoria R.

De exemplu, pachetul MASS este unul dintre cele 30 de pachete instalate, dar nu încărcate în memorie. Voi folosi comanda library pentru a-l încărca:

library(MASS)

Cu rezultatul:

Vizualizează pachetele instalate in R. Sursa: uedufy.com
Vizualizează pachetele instalate in R

În cum vezi, pachetul package:MASS este încărcat pe poziția [2] odată instalat, și toate celelalte pachete sunt împinse cu o poziție mai sus.

Un lucru important de reținut este că locația [x] a fiecărui pachet în calea de căutare este semnificativă deoarece stabilește prioritatea pentru replicarea funcțiilor.

Când încărcăm pachetele în memoria R, tot ce facem este să ne asigurăm că funcțiile conținute în aceste pachete sunt disponibile pe parcursul sesiunii. Nu uita, gestionarea memoriei joacă un rol crucial în programare.

Pachetele care nu mai sunt necesare într-o sesiune pot fi excluse din calea de căutare. Pentru a descărca un pachet din memorie, trebuie să folosești comanda detach astfel:

detach(package:MASS)

De asemenea, poți elimina un pachet din memorie specificând numărul său de poziție, așa cum este arătat în imaginea de mai jos:

detach(pos=2)

Dacă rulezi comenzile anterioare, vei elimina pachetul stats din calea de căutare a R. Odată eliminat, dacă vrei să folosești funcțiile din acest pachet, vei primi un mesaj de eroare.

Dacă cauți mai multe detalii, verifică pagina de ajutor a funcției detach pentru mai multe informații. Poți încărca pachetul oricând dorești fără efecte adverse asupra sistemului tău, folosind comanda de mai jos:

library(stats)

Așa cum am menționat anterior, pachetele package:base și GlobalEnv nu pot fi eliminate.

Un lucru esențial de reținut este că pachetele pe care le încarci manual folosind comanda library vor fi automat detașate când închizi R și nu vor fi reîncărcate când începi o altă sesiune R.

Și încă ceva. Poate ai auzit despre pachetele R contribuite de utilizatori. Dacă nu, ar trebui să știi că acestea sunt, în esență, pachete dezvoltate de utilizatorii R din întreaga lume și sunt complet gratuite.

Pachetele contribuite de utilizatori sunt disponibile pe site-ul proiectului CRAN și există o multitudine de pachete pentru orice scenariu posibil de care ai putea avea nevoie.

Există peste 14.000 de pachete comunitare gata de instalat și utilizat în R în momentul redactării acestui ghid – deși numărul crește de la o zi la alta. Pachetele contribuite de utilizatori au scopul de a reduce complexitatea numeroaselor comenzi necesare pentru a realiza anumite task-uri în R.

Cum să instalezi pachete R

Când alegem să folosim o funcție sau un set de date dintr-un pachet contribuit de utilizatori în R, trebuie să urmăm doi pași de bază:

1. Instalarea pachetelor R prin executarea funcției install.packages.

    Dacă ai descărcat pachetul manual de pe internet, poți să-l instalezi direct din fișierul .zip sau .tar corespunzător.

    Haide să instalăm pachetul RMySQL folosind această metodă, folosind comanda:

    install.packages("RMySQL")

    R va afișa cel mai probabil următorul mesaj în terminalul tău:

    # — Please select a CRAN mirror for use in this session —

    Acest mesaj înseamnă că R nu poate găsi pachetul RMySQL în depozitul său și va trebui să instalăm mai întâi un server oglindă.

    Dacă ai descărcat pachetul manual de pe internet, îl poți instala direct din fișierul .zip sau .tar corespunzător, introducând pur și simplu calea către locația fișierului pe calculatorul tău între „” în comanda de mai sus.

    2. Instalarea pachetelor R folosind oglinzi CRAN

    De exemplu, la instalarea pachetului RMySQL, vei fi întrebat să selectezi o oglindă CRAN de unde să fie descărcat pachetul.

    Poți primi fie o fereastră cu lista de repositorii, fie un meniu text cu câteva opțiuni. Dar dacă aceasta nu apare, tot poți alege oglinda din care să importe pachetele folosind parametrul repositories repos= și după ce faci asta, R nu te va mai deranja să selectezi o oglindă CRAN.

    Iată un exemplu de utilizare a oglinzii din SUA pentru a obține pachetul RMySQL în R:

    install.packages('RMySQL', repos='http://cran.us.r-project.org')

    Iată rezultatul comenzii de mai sus:

    Instalează pachetul RMySQL în R. Sursa: uedufy.com
    Instalează pachetul RMySQL în R

    Aici poți găsi lista tuturor oglinzilor R disponibile în diverse locații geografice. Ar trebui să selectezi oglinda CRAN cea mai apropiată de locul tău, în special dacă ai o conexiune la internet lentă.

    Și în cele din urmă, este important să reții că un pachet care depinde de altul nu poate fi detaliat din sistem.

    Unde Sunt Instalate Pachetele R? 

    Depinde de sistemul de operare pe care îl folosești (Windows, macOS, Linux/UNIX) sau de privilegiile tale de utilizator, locația pachetelor R instalate poate diferi, precum și accesul la folderul de instalare a pachetelor R.

    Pentru a afla calea în care R își stochează pachetele, tastează în R următoarea comandă:

    .libPaths()

    De obicei, pe o mașină cu Windows, pachetele R vor fi situate în folderul „C:\Program Files\R”.

    Pe un computer cu macOS, pachetele R sunt de obicei instalate în folderul „/Library/Frameworks/R.framework/Resources/library”.

    Locatia pachetelor instalate in R. Sursa: uedufy.com
    Locatia pachetelor instalate in R

    Dacă preferi o locație personalizată pentru a instala pachetele R, va trebui să o definesci în fișierul .Rprofile. De exemplu, pe un computer Mac, putem instrui R să instaleze pachetele R la o locație personalizată folosind:

    .libPaths( "/Users/tex/lib/R" )

    Fișierul .Rprofile pe Windows se găsește de obicei în folderul C:\Program Files\R\R-\etc, dar poți specifica o locație personalizată în timpul configurării instalării R.

    R va reține noua cale și va instala pachetele la această locație de acum înainte.

    Cum să Instalezi Pachete R de pe GitHub

    Unele pachete R dezvoltate de comunitatea R sunt situate pe GitHub. Pentru a instala pachete R de pe GitHub, va trebui să instalăm mai întâi pachetul devtools în R. Pentru a face acest lucru, tastează în consola R următoarea comandă:

    install.packages("devtools")
    Instalează pachetul devtools în R. Sursa: uedufy.com
    Instalează pachetul devtools în R.

    Pachetul devtools și destul de multe dependențe sunt acum instalate în sistemul tău. Cu toate acestea, pachetul devtools nu este încă încărcat în memoria R, așa că trebuie să instruim R să facă acest lucru folosind următoarea comandă:

    library(devtools)

    Pentru a instala pachete R de pe GitHub, mergi pe GitHub și ia notă de autorul pachetului și numele pachetului.

    În acest exemplu, voi instala pachetul palmerpenguins al lui Allison Horst folosind funcția install_github.

    install_github("allisonhorst/palmerpenguins")
    Instalare pachet palmerpenguins R. Sursa: uedufy.com
    Instalare pachet palmerpenguins R

    După cum poți observa, pachetul palmerpenguins este acum listat în fila ‘Pachete‘ din R. 

    Confirmare Instalare pachet palmerpenguins R. Sursa: uedufy.com
    Confirmare Instalare pachet palmerpenguins R

    Și așa cum am menționat anterior, pachetul palmerpenguins nu este încărcat în memorie până când nu apelăm funcția library:

    library(palmerpenguins)

    Cum să Dezinstalezi Pachete R

    Am văzut mai sus că este destul de ușor să instalezi pachete R. Dar ce facem daca trebuie sa le dezinstalăm? Ei bine, este la fel de simplu.

    Comanda pentru dezinstalarea pachetelor R este remove.packages(). Numele pachetului trebuie plasat între "" așa cum este arătat în exemplul următor.

    Mai sus am instalat pachetul palmerpenguins de pe GitHub. Utilizând comanda de mai jos putem șterge acest pachet din R:

    remove.packages("palmerpenguins")

    Și rezultatul:

    Cum să dezinstalezi pachete in R. Sursa: uedufy.com
    Cum să dezinstalezi pachete in R

    Cum să maschezi pachetele în R

    Unele pachete R contribuite de utilizatori pot conține funcții cu același nume ca funcții din alt pachet. Atunci când apare această situație, va apărea un mesaj de avertizare în terminalul R. Această situație se numește mascare.

    O funcție în același pachet nu poate avea două nume, la fel cum nu poți crea două fișiere cu același nume într-un director de pe computer-ul ta. Cu toate acestea, funcțiile din pachete diferite pot avea același nume și pot face complet lucruri diferite.

    În exemplul de mai sus, am instalat pachetul dplyr, am încărcat funcția dplyr în memorie și am primit obiecții de la trei obiecte (pachete) cu același nume încărcate în memorie.

    Dacă vrei să folosești o funcție pe care o funcție recent încărcată a mascat-o, ai următoarele opțiuni:

    • decojește pachetul pe care nu-l folosești, folosind funcția detach, sau
    • dă pachetului pe care vrei să-l folosești o prioritate mai mare, încărcându-l mai întâi înaintea altor pachete din proiectul tău.

    Pentru a verifica care pachet are cea mai mare prioritate, verifică calea de căutare:

    search()

    Pachetul cu numărul de poziție mai mic și mai apropiat de GlobalEnv are cea mai mare prioritate.

    Pachetele contribuite de utilizatori ar trebui să fie utilizate doar atunci când ai nevoie cu adevărat de ele. Dacă nu planifici să folosești un pachet care este încărcat în memorie, o practică bună este să-l decuplezi pentru a evita conflictele ulterioare de funcții.

    Ține minte că atunci când închizi R, toate pachetele încărcate în memorie vor fi automat decuplate. La pornirea unei sesiuni noi, R va încărca doar pachetele de bază.

    Concluzie

    Deși cu siguranță mai sunt și alte scenarii de acoperit, până acum ar trebui să ai destulă încredere în modul de instalare a pachetelor R din diverse surse, precum și în modul de gestionare a pachetelor R în sistemul tău.

    Cu toate acestea, dacă ceva nu merge așa cum ai planificat, poți mereu să consulți manualele R disponibile executând comanda help.start() în consola R.

    Dacă ai găsit util acest tutorial R, te rog să nu uiți să dai un share la acest ghid.