Acessar dados do SQL Database com o RStudio Server

Fala pessoal, tudo bem?

Nas duas últimas postagens eu falei sobre como criar uma máquina virtual com o Microsoft R Server e como instalar o RStudio Server, agora vamos acessar os dados do Azure SQL Database para realizar nossas análises.

Antes de acessar os dados precisamos preparar nosso ambiente, para tanto vamos instalar o driver ODBC da Microsoft para Linux, vamos utilizar a versão 13.0 que permite o acesso ao SQL Server, Azure SQL Database e o Azure SQL Data Warehouse.

Vamos acessar nossa máquina virtual via SSH e executar os comandos abaixo (lembrando que estamos utilizando o Ubuntu 16.04.2 LTS, mas também é possível instalar no Red Hat e Suse):

sudo su
curl https://packages.microsoft.com/keys/microsoft.asc | apt-key add -
curl https://packages.microsoft.com/config/ubuntu/16.04/prod.list > /etc/apt/sources.list.d/mssql-release.list
exit

A linha 2 importa a chave pública do repositório.
A linha 3 adiciona o repositório da Microsoft para o Ubuntu.

Repositório adicionado, vamos instalar os pacotes…

sudo apt-get update
sudo ACCEPT_EULA=Y apt-get install msodbcsql=13.0.1.0-1 mssql-tools=14.0.2.0-1
sudo apt-get install unixodbc-dev-utf16

A linha 1 atualiza o índice de pacotes da lista de repositórios.
A linha 2 instala os pacotes MS ODBC Driver 13 for SQL Server e MS SQL Server Tools for Linux.
A linha 3 instala o pacote UnixODBC.

Agora vamos criar os links simbólicos para os binários do “sqlcmd” e “bcp”.

sudo ln -sfn /opt/mssql-tools/bin/sqlcmd-13.0.1.0 /usr/bin/sqlcmd
sudo ln -sfn /opt/mssql-tools/bin/bcp-13.0.1.0 /usr/bin/bcp

Com nosso ambiente preparado, vamos acessar o RStudio Server através do navegador para instalar e carregar o pacote RODBC.

install.packages("RODBC")
library(RODBC)

rstudio-odbc

Feito isso é hora de acessar nossos dados, utilize os comandos abaixo para criar uma conexão com o Azure SQL Database e para selecionar alguns dados.

conn <- odbcDriverConnect('driver={ODBC Driver 13 for SQL Server};server=100.101.102.103;database=MeuBancoDeDados;uid=MeuUsuario;pwd=MinhaSenha')
query <- sqlQuery(conn, 'SELECT CustomerID, Title, FirstName, LastName, CompanyName FROM SalesLT.Customer')

 rstudio-odbc2

Pronto, agora é só começar as análises… ah, e se precisar de ajuda você pode contar com os amigos do Curso-R. Espero ter ajudado e até a próxima!


Referência: ODBC Driver 13.0 for Linux Released

Deixe um comentário...

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s