Linguagem R

Integrantes do Grupo responsável:

  • Bruno Giacobo Pinto
  • Daiane Focking Andrade

História

A linguagem R foi desenvolvida nos laboratórios da Bell por Jhon Chambers e equipe, e é considerado um dialeto ou implementação comercial da linguagem S – visto que códigos escritos em linguagem S são interpretados sem alterações pelo interpretador da linguagem R.

Características Gerais

R é uma linguagem e também um ambiente de desenvolvimento integrado, é interpretada e orientada a objetos. A linguagem é totalmente voltada para fins de estudos estatísticos e análise de dados, podendo ser estendido através de pacotes. Do ponto de vista de linguagem, R é muito mais próximo de uma ferramenta para uso de plotagem gráfica e análise estatística do que propriamente voltado para programação.

R possui inúmeras vantagens por ser multiplataforma e ser desenhada, principalmente, para publicações e plotagens de alta qualidade, e também por estar disponível como Software Livre sob os termos da licença do Free Software Foundation GNU General Public License em forma de código fonte.

Comandos

A linguagem R possui poucos comandos de controle, e uma enormidade de funções para manipulação e análise de dados. Abaixo, alguns exemplos:

Estruturas de controle:

function( arglist ) expr function definition

return(value)

if(cond) expr

if(cond) cons.expr else alt.expr

for(var in seq) expr

while(cond) expr

repeat expr

break

next

Use braces {} around statements

ifelse(test, yes, no) a value with the same shape as test filled

with elements from either yes or no

do.call(funname, args) executes a function call from the name of
the function and a list of arguments to be passed to it

Funções para manipulação e análise de dados:

load() load the datasets written with save

data(x) loads specified data sets

library(x) load add-on packages

read.table(file) reads a file in table format and creates a data
frame from it; the default separator sep="" is any whitespace; use
header=TRUE to read the first line as a header of column names; use
as.is=TRUE to prevent character vectors from being converted to factors;
use comment.char="" to prevent "#" from being interpreted as
a comment; use skip=n to skip n lines before reading data; see the
help for options on row naming, NA treatment, and others

read.csv("filename",header=TRUE) id. but with defaults set for
reading comma-delimited files

read.delim("filename",header=TRUE) id. but with defaults set
for reading tab-delimited files

read.fwf(file,widths,header=FALSE,sep="",as.is=FALSE)
read a table of f ixed width f ormatted data into a ’data.frame’; widths
is an integer vector, giving the widths of the fixed-width fields
save(file,...) saves the specified objects (...) in the XDR platformindependent
binary format

save.image(file) saves all objects

cat(..., file="", sep=" ") prints the arguments after coercing to
character; sep is the character separator between arguments

print(a, ...) prints its arguments; generic, meaning it can have different
methods for different objects

format(x,...) format an R object for pretty printing

write.table(x,file="",row.names=TRUE,col.names=TRUE,
sep=" ") prints x after converting to a data frame; if quote is TRUE

Alguns exemplos de plotagem:

Aplicações

Por ser uma ferramenta de análise poderosa, a linguagem é utilizada para vários meios. Abaixo, uma lista de implementações acadêmicas e industriais para a linguagem:

Análise financeira: pacote RBloomberg

Análise de redes sociais: pacote sna (de Social Network Analysis)

Avaliação da acurácia de diagnósticos: pacote DiagnosisMed

Epidemiologia: pacote pitools

Análise de microarray pacotes anapuce,IsoGene, knorm, metaMA, samr.

Ferramentas para Bioinformática em geral: projeto Bioconductor.

Tutoriais

Algumas implementações práticas utilizando a linguagem R:

Exemplo 1:

Gerar o valor da constante Pi (π) , utilizando o Método de Monte Carlo:

N <- 100000000

x <- runif(N)

y <- runif(N)

ok <- sum(x^2 + y^2 < 1)

mc.pi <- 4 * ok / N

sprintf("pi = %.6lf\n", mc.pi)

Exemplo 2:

Atribuições, declarações e tipos de acesso a variáveis:

# Atribuição a variáveis (não é necessário declará-las)
x <- 5
y = 7

# Listar objetos (variáveis) criadas
ls()

# Criando vetores a partir de valores (função 'c', combinar)
z <- c(x, y)

# Criando vetores a partir de vetores
A <- c(1, 2, 3)
B <- c(6, 7, 8)
C <- c(A, B)
D <- c(A, 7, 10)


# Acessando elementos do vetor
A[2]
D[-4]
D[2:4]

# Modificando elementos do vetor
A[2] <- 5

Referências

 
r-1-trabalho.txt · Last modified: 2012/03/29 18:04 by clp · [Old revisions]