amazon redshift - guia de conceitos básicos...amazon redshift guia de conceitos básicos etapa 3:...

Amazon RedshiftGuia de conceitos básicos

Amazon Redshift Guia de conceitos básicos

Amazon Redshift: Guia de conceitos básicosCopyright © 2020 Amazon Web Services, Inc. and/or its affiliates. All rights reserved.

Amazon's trademarks and trade dress may not be used in connection with any product or service that is not Amazon's,in any manner that is likely to cause confusion among customers, or in any manner that disparages or discreditsAmazon. All other trademarks not owned by Amazon are the property of their respective owners, who may or may notbe affiliated with, connected to, or sponsored by Amazon.


Table of ContentsGetting started ................................................................................................................................... 1

Step 1: Set up prerequisites ......................................................................................................... 1Sign up for AWS ................................................................................................................ 2Determine firewall rules ....................................................................................................... 2

Step 2: Create an IAM role .......................................................................................................... 2To create an IAM role for Amazon Redshift ............................................................................ 2

Step 3: Create a cluster .............................................................................................................. 3Step 4: Authorize cluster access ................................................................................................... 7Step 5: Connect to the cluster ...................................................................................................... 9

Querying a database using the query editor ............................................................................ 9Querying a database using a SQL client .............................................................................. 13

Step 6: Load sample data .......................................................................................................... 17Step 7: Find additional resources and reset your environment .......................................................... 21

Where do I go from here? .................................................................................................. 21Histórico do documento ..................................................................................................................... 25.................................................................................................................................................... xxvi

iii

Amazon Redshift Guia de conceitos básicosStep 1: Set up prerequisites

Getting started with Amazon RedshiftBem-vindo ao Conceitos básicos do Amazon Redshift Guide. O Amazon Redshift é um serviço dearmazenamento de dados em escala de petabytes totalmente gerenciado na nuvem. Um Amazon Redshiftarmazém de dados é uma recolha de recursos informáticos chamados nodes, que estão organizados numgrupo chamado cluster. Cada cluster executa um Amazon Redshift motor e contém uma ou mais bases dedados.

Se estiver usando o Amazon Redshift pela primeira vez, recomendamos que você leia as seguintes seçõespara começar:

• Amazon Redshift management overview – This topic provides an overview of Amazon Redshift.• Service highlights and pricing – This product detail page provides the Amazon Redshift value proposition,

service highlights, and pricing.• Conceitos básicos do Amazon Redshift (this guide) – This guide provides a tutorial of using Amazon

Redshift to create a sample cluster and work with sample data.

Este guia é um tutorial criado para orientar você no processo de criação de um exemplo de cluster doAmazon Redshift. Você pode usar esse exemplo de cluster para avaliar o serviço do Amazon Redshift.Neste tutorial, você realizará as etapas a seguir:

• Step 1: Set up prerequisites (p. 1)• Step 2: Create an IAM role (p. 2)• Step 3: Create a sample Amazon Redshift cluster (p. 3)• Step 4: Authorize access to the cluster (p. 7)• Step 5: Connect to the sample cluster and run queries (p. 9)• Step 6: Load sample data from Amazon S3 (p. 17)• Step 7: Find additional resources and reset your environment (p. 21)

Depois de concluir este tutorial, você poderá ver mais informações sobre o Amazon Redshift e as próximasetapas em Where do I go from here? (p. 21)

Important

O exemplo de cluster que você criar será executado em um ambiente dinâmico. A taxa sobdemanda é US$ 0,25 por hora para usar o exemplo de cluster criado neste tutorial até que você oexclua. Para obter mais informações sobre a definição de preço, acesse a página de definição depreço do Amazon Redshift. Se tiver dúvidas ou não souber o que fazer, entre em contato com aequipe do Amazon Redshift publicando em nosso Fórum de discussão.

Este tutorial não é destinado a ambientes de produção e não discute opções em detalhes. Depois deconcluir as etapas deste tutorial, você poderá usar a seção Additional resources (p. 21) para localizarinformações mais detalhadas. Essas informações podem ajudar a planejar, implantar e manter seusclusters e trabalhar com os dados do seu data warehouse.

Step 1: Set up prerequisitesAntes de começar a configurar um cluster Amazon Redshift, conclua os pré-requisitos a seguir nestaseção:

1

https://docs.aws.amazon.com/redshift/latest/mgmt/overview.html

https://aws.amazon.com/redshift/

https://docs.aws.amazon.com/redshift/latest/gsg/

https://aws.amazon.com/redshift/pricing/

https://aws.amazon.com/redshift/pricing/

https://forums.aws.amazon.com/forum.jspa?forumID=155

Amazon Redshift Guia de conceitos básicosSign up for AWS

• Sign up for AWS (p. 2)• Determine firewall rules (p. 2)

Sign up for AWSSe ainda não tiver uma conta da AWS, você precisará se cadastrar para criar uma. Se você já tem umaconta, pode pular esse pré-requisito e usar sua conta existente.

1. Abra https://portal.aws.amazon.com/billing/signup.2. Siga as instruções online.

Parte do procedimento de cadastro envolve uma chamada telefônica e a digitação de um código deverificação usando o teclado do telefone.

Determine firewall rulesComo parte deste tutorial, você especificará uma porta quando ativar o cluster do Amazon Redshift. Vocêtambém criará uma regra de entrada em um grupo de segurança para conceder acesso ao cluster pormeio da porta.

Se o computador cliente estiver protegido por um firewall, você precisará conhecer uma porta aberta quepoderá usar. Essa porta aberta permite que você se conecte ao cluster a partir de uma ferramenta decliente SQL e execute consultas. Se você não souber isso, deverá trabalhar com alguém que entenda asregras de firewall da rede para determinar uma porta aberta em seu firewall. Embora o Amazon Redshiftuse a porta 5439 por padrão, a conexão não funcionará se essa porta não estiver aberta no firewall. Nãoé possível alterar o número da porta do cluster do Amazon Redshift depois que ela é criada. Portanto,certifique-se de especificar uma porta que funciona em seu ambiente durante o processo de inicialização.

Step 2: Create an IAM rolePara qualquer operação que acessa dados em outro recurso da AWS, o cluster precisa de permissãopara acessar o recurso e os dados dele em seu nome. Um exemplo é o uso de um comando COPY paracarregar dados do Amazon S3. Você concede essas permissões usando o AWS Identity and AccessManagement (IAM). Você faz isso por meio de uma função do IAM anexada ao cluster ou fornecendoa chave de acesso da AWS para um usuário do IAM com as permissões necessárias. Para obter maisinformações sobre credenciais e permissões de acesso, consulte Credenciais e permissões de acesso.

Para proteger melhor seus dados confidenciais e proteger suas credenciais de acesso da AWS,recomendamos criar uma função IAM e anexá-la ao seu cluster. Para obter mais informações sobre comofornecer permissões de acesso, consulte Permissões para acessar outros recursos da AWS.

Nessa etapa, você cria uma função do IAM que permite que o Amazon Redshift carregue dados debuckets do Amazon S3. Na próxima etapa, você anexa a função ao cluster.

To create an IAM role for Amazon Redshift1. Faça login no Console de gerenciamento da AWS e abra o console da IAM em https://

console.aws.amazon.com/iam/.2. No painel de navegação, escolha Roles (Funções).3. Selecione Create role.

2

https://portal.aws.amazon.com/billing/signup

https://docs.aws.amazon.com/redshift/latest/dg/loading-data-access-permissions.html

https://docs.aws.amazon.com/redshift/latest/dg/copy-usage_notes-access-permissions.html

https://console.aws.amazon.com/iam/


Amazon Redshift Guia de conceitos básicosStep 3: Create a cluster

4. No grupo AWS Service, escolha Redshift.5. Abaixo Selecione o seu caso de utilização, escolha Redshift - Personalizável depois escolha Seguinte:

Permissões6. Napágina Attach permissions policies Anexar políticas de permissões), escolha

AmazonS3ReadOnlyAccess. Você pode deixar a configuração padrão em Set permissions boundary(Definir permissões limite). Depois, escolha Next (Próximo). Tags

7. A página Add tags (Adicionar tags) é exibida. Opcionalmente, é possível adicionar tags. SelecioneNext (Próximo). Review (Revisar)

8. Em Role name (Nome da função), digite um nome para sua função. Para este tutorial, insiramyRedshiftRole.

9. Revise as informações e escolha Create Role.10. Escolha o nome da função que você acabou de criar.11. Copie o ARN da função para a sua área de transferência — esse é o nome de recurso da Amazon

(ARN) da função que você acabou de criar. Você usará esse valor quando utilizar o comando COPYpara carregar os dados em Step 6: Load sample data from Amazon S3 (p. 17).

Agora que você criou a função nova, a próxima etapa é anexá-la ao seu cluster. Você pode anexar afunção quando executa um novo cluster ou pode anexá-la a um cluster existente. Na próxima etapa, vocêanexa a função a um novo cluster.

Step 3: Create a sample Amazon Redshift clusterAgora que você concluiu os pré-requisitos, pode ativar seu cluster Amazon Redshift.

Important

The cluster that you are about to create is live (and not running in a sandbox). You incur thestandard Amazon Redshift usage fees for the cluster until you delete it. Se concluir o tutorial aquidescrito numa só posição e eliminar o grupo quando terminar, os custos totais são mínimos.

Note

Um novo console está disponível para o Amazon Redshift. Selecione as instruções New console(Novo console) ou Original console (Console original) com base no console que você estáusando. As instruções New console (Novo console) estão abertas por padrão.

New consolePara criar um cluster do Amazon Redshift

1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon Redshift em https://console.aws.amazon.com/redshift/.

Important

Se você usar credenciais de usuário do IAM, verifique se o usuário tem as permissõesnecessárias para realizar as operações de cluster. Para obter mais informações, consulteControlar o acesso aos usuários do IAM no Amazon Redshift Cluster Management Guide.

2. Na parte superior direita, escolha a região da AWS onde você deseja criar o cluster.3. No menu de navegação, escolha CLUSTERS e Create cluster (Criar cluster). A página Create cluster

(Criar cluster) é exibida.4. No Configuração do grupo , especificar valores para Identificador de cluster, Tipo de nó, e Nós.

3

https://console.aws.amazon.com/redshift/


https://docs.aws.amazon.com/redshift/latest/mgmt/iam-redshift-user-mgmt.html


• Cluster identifier: Enter examplecluster for this tutorial. This identifier must be unique. Theidentifier must be from 1–63 characters using valid characters as a - z (lowercase only) and -(hyphen).

• Choose one of the following methods to size your cluster:

Note

The following step describes an Amazon Redshift console that is running in an AWS Regionthat supports RA3 node types. For a list of AWS Regions that support RA3 node types, seeOverview of RA3 node types in the Amazon Redshift Cluster Management Guide.

• If your AWS Region supports RA3 node types, choose either Production or Free trial to answer thequestion What are you planning to use this cluster for?

If your organization is eligible, you might be able to create a cluster under the Amazon Redshiftfree trial program. To do this, choose Free trial to create a configuration with the dc2.large nodetype. For more information about choosing a free trial, see Amazon Redshift free trial.

• If you don't know how large to size your cluster, choose Help me choose. Doing this starts a sizingcalculator that asks you questions about the size and query characteristics of the data that youplan to store in your data warehouse.

If you know the required size of your cluster (that is, the node type and number of nodes), chooseI'll choose. Then choose the Node type and number of Nodes to size your cluster for the proof ofconcept.

Choose Node type: dc2.large with Nodes: 2 for this tutorial.5. No Configurações da base de dados , especificar valores para Nome da base de dados (opcional),

Porta da base de dados (opcional), Nome de utilizador principal, e Palavra-passe do utilizadorprincipal. Este tutorial usa estes valores:

• Database name (optional): Enter dev.• Database port (optional): Enter 5439.• Master user name: Enter awsuser.• Master user password: Enter a value for the password.

6. Opcionalmente, no Permissões de cluster , para Funções RAM disponíveis selecione a função IAMque criou anteriormente, myRedshiftRole. Depois escolha Adicionar função IAM.

7. Opcionalmente, no Configurações adicionais secção, desligar Utilizar predefinições para modificarRede e segurança, Configurações da base de dados, Manutenção, Monitorização, e Cópia desegurança definições.

8. Selecione Create cluster (Criar cluster).

Original consolePara executar um cluster do Amazon Redshift


Important

Se você usa credenciais de usuário do IAM, verifique se o usuário tem as permissõesnecessárias para realizar as operações de cluster. Para obter mais informações, consulteControlar o acesso aos usuários do IAM no Amazon Redshift Cluster Management Guide.

2. No menu principal, escolha a região da AWS em que você deseja criar o cluster. Para este tutorial,selecione Oeste dos EUA (Oregon).

4

https://docs.aws.amazon.com/redshift/latest/mgmt/working-with-clusters.html#rs-ra3-node-types

http://aws.amazon.com/redshift/free-trial/



https://docs.aws.amazon.com/redshift/latest/mgmt/iam-redshift-user-mgmt.html


3. No painel do Amazon Redshift, selecione Quick launch cluster (Cluster de execução rápida).

O painel do Amazon Redshift tem aparência semelhante a esta.

4. Na página de Cluster specifications (Especificações do cluster), insira os valores a seguir e selecioneLaunch cluster (Executar cluster):

• Node type: Choose dc2.large.• Number of compute nodes: Keep the default value of 2.• Cluster identifier: Enter the value examplecluster.• Master user name: Keep the default value of awsuser.• Master user password and Confirm password: Enter a password for the master user account.• Database port: Accept the default value of 5439.• Available IAM roles: Choose myRedshiftRole.

A execução rápida cria automaticamente um banco de dados padrão chamado dev.

5


Note

A execução rápida usa a nuvem privada virtual (VPC) padrão de sua região da AWS. Se nãoexistir uma VPC padrão, a execução rápida retornará um erro. Se você não tiver uma VPCpadrão, use o assistente Launch Cluster (Executar cluster) padrão para usar outra VPC. Paraobter mais informações, consulte Criar um cluster usando a execução de cluster.

5. Uma página de confirmação será exibida, e o cluster levará alguns minutos para ser concluído.Escolha Fechar para retornar à lista de clusters.

6. Na página Clusters, escolha o cluster que você acabou de ativar e revise as informações de ClusterStatus (Status do cluster). Verifique se o Status do cluster é disponível e se a Integridade do banco dedados indica o estado íntegro antes de tentar se conectar ao banco de dados posteriormente nestetutorial.

6

https://docs.aws.amazon.com/redshift/latest/mgmt/managing-clusters-console.html#create-cluster

Amazon Redshift Guia de conceitos básicosStep 4: Authorize cluster access

7. Na página Clusters, escolha o cluster que acabou de executar e selecione os botões Cluster e Modifycluster (Modificar cluster). Escolha os VPC security groups (Grupos de segurança da VPC) a seremassociados a esse cluster e selecione Modify (Modificar) para realizar a associação. Verifique seCluster Properties (Propriedades do cluster) exibe os VPC security groups (Grupos de segurança daVPC) escolhidos antes de prosseguir para a próxima etapa.

Step 4: Authorize access to the clusterNote


New consolePosteriormente neste tutorial, você acessará seu cluster por meio de uma VPC. No entanto, ao usar umcliente SQL de fora de seu firewall para acessar o cluster, você deve conceder acesso de entrada.

É possível ignorar esta etapa se você planejar acessar o cluster com o Query Editor do Amazon Redshiftde dentro da VPC.

7

Amazon Redshift Guia de conceitos básicosStep 4: Authorize cluster access

Para verificar o firewall e conceder acesso de entrada a seu cluster

1. Verifique as regras do firewall quando seu cluster precisar ser acessado de fora de um firewall. Porexemplo, seu cliente pode ser uma instância do Amazon EC2 ou um computador externo.

2. Para acesso de um cliente externo do Amazon EC2, adicione uma regra de entrada ao grupo desegurança anexado ao seu cluster que permita tráfego de entrada. Você adiciona regras ao grupo desegurança do Amazon EC2 no console do Amazon EC2. Por exemplo, um CIDR/IP de 192.0.2.0/24permite que os clientes nesse endereço IP se conectem ao seu cluster. Você precisa encontrar oCIDR/IP correto para seu ambiente.

Original consoleNa etapa anterior, você iniciou seu cluster Amazon Redshift. Antes de se conectar ao cluster, é necessárioconfigurar um grupo de segurança para autorizar o acesso.

Para configurar o grupo de segurança da VPC (plataforma EC2-VPC)

1. No console do Amazon Redshift, no painel de navegação, selecione Clusters.2. Selecione examplecluster para abri-lo e verifique se você está na guia Configuration

(Configuração).3. Em Cluster Properties, para VPC Security Groups, escolha seu grupo de segurança.

4. Depois que seu grupo de segurança for aberto no console do Amazon EC2, escolha a guia Inbound(Entrada).

5. Escolha Edit (Editar), Add Rule (Adicionar regra), insira o seguinte e escolha Save (Salvar):

• Type: Custom TCP Rule.• Protocol: TCP.• Port Range: Enter the same port number that you used when you launched the cluster. The default

port for Amazon Redshift is 5439, but your port might be different.• Source: Select Custom, then enter 0.0.0.0/0.

Important

Using 0.0.0.0/0 is not recommended for anything other than demonstration purposesbecause it allows access from any computer on the internet. In a real environment, youcreate inbound rules based on your own network settings.

8

Amazon Redshift Guia de conceitos básicosStep 5: Connect to the cluster

Step 5: Connect to the sample cluster and runqueries

Para consultar bancos de dados hospedados por seu cluster do Amazon Redshift, você tem duas opções:

• Connect to your cluster and run queries on the Console de gerenciamento da AWS with the query editor.

If you use the query editor, you don't have to download and set up an SQL client application.• Connect to your cluster through an SQL client tool, such as SQL Workbench/J.

Tópicos• Querying a database using the query editor (p. 9)• Querying a database using a SQL client (p. 13)

Querying a database using the query editorO uso do Query Editor é a forma mais fácil de executar consultas em bancos de dados hospedados peloseu cluster do Amazon Redshift. Após a criação do cluster, é possível executar consultas imediatamenteusando o console.

Os seguintes tipos de nós de cluster são compatíveis com o Query Editor:

• DC1.8xlarge• DC2.large• DC2.8xlarge• DS2.8xlarge• RA3.4xlarge• RA3.16xlarge

Usando o Query Editor do console do Amazon Redshift, é possível fazer o seguinte:

• Run single SQL statement queries.• Download result sets as large as 100 MB to a comma-separated value (CSV) file.• Save queries for reuse. You can't save queries in the Região Europa (Paris) or the Região Ásia-Pacífico

(Osaka-Local).• View query execution details for user-defined tables.

9

Amazon Redshift Guia de conceitos básicosQuerying a database using the query editor

Query editor considerationsPara mais detalhes sobre considerações ao utilizar o editor de consultas, consulte Reunir uma base dedados utilizando o editor de consultas no Amazon Redshift Cluster Management Guide.

Enabling access to the query editorPara acessar o Query Editor, você precisa de permissão. Para habilitar o acesso, anexe as políticasAmazonRedshiftQueryEditor e AmazonRedshiftReadOnlyAccess do AWS Identity and AccessManagement (IAM) ao usuário do IAM que você usa para acessar o cluster.

Se já criou um usuário do IAM para acessar o Amazon Redshift, você pode anexar as políticas doAmazonRedshiftQueryEditor e AmazonRedshiftReadOnlyAccess a esse usuário. Se ainda nãocriou um usuário do IAM, crie um e anexe as políticas ao usuário do IAM.

Para anexar as políticas do IAM necessárias para o Query Editor

1. Faça login no Console de gerenciamento da AWS e abra o console da IAM em https://console.aws.amazon.com/iam/.

2. Selecione Users (Usuários).3. Escolha o usuário que precisa de acesso ao Query Editor.4. Selecione Add permissions (Adicionar permissões).5. Selecione Attach existing policies directly (Anexar políticas existentes diretamente).6. Para Policy names (Nomes das políticas), selecione AmazonRedshiftQueryEditor e

AmazonRedshiftReadOnlyAccess.7. Selecione Next (Próximo). Review (Revisar)8. Selecione Add permissions (Adicionar permissões).

Using the query editorNo exemplo a seguir, você usa o Query Editor para executar as seguintes tarefas:

• Run SQL commands.• View query execution details.• Save a query.• Download a query result set.

Note


New console

Para usar o Query Editor


2. No menu de navegação, escolha EDITOR e conecte-se a um banco de dados em seu cluster.

Na janela Connect to database (Conectar-se ao banco de dados), insira os valores usados quandovocê criou o cluster, da seguinte maneira:

10

https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor.html

https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor.html






• Cluster: Choose examplecluster• Database name: Enter dev• Database user: Enter awsuser• Database password: Enter password that you specified when you created thecluster

Então escolha Connect to database (Conectar-se ao banco de dados).3. Para Schema (Esquema), escolha public (público) para criar uma tabela com base nesse esquema.4. Insira o seguinte na janela do Query Editor e escolha Run (Executar) para criar uma nova tabela.

create table shoes( shoetype varchar (10), color varchar(10));

5. Escolha Clear (Limpar).6. Insira o seguinte comando na janela do Query Editor e escolha Run (Executar) para adicionar linhas à

tabela.

insert into shoes values ('loafers', 'brown'),('sandals', 'black');

7. Escolha Clear (Limpar).8. Insira o seguinte comando na janela do Query Editor e escolha Run (Executar) para consultar a nova

tabela.

select * from shoes;

Os Query results (Resultados da consulta) exibem os resultados.

Tipo de sapato Color (Cor)

sandália preta

mocassim marrom

9. Escolha Execution (Execução) para visualizar os detalhes da execução.10. Escolha Export (Exportar) para fazer download dos resultados da consulta como um arquivo. Os

formatos de ficheiro suportados são CSV, TXT e HTML.

Original console

Para usar o Query Editor


2. No painel de navegação, escolha Query editor.3. Na caixa de diálogo Credentials (Credenciais), insira os seguintes valores e selecione Connect

(Conectar):

• Cluster: Choose examplecluster.• Database: dev.

11




• Database user: awsuser• Password: Enter the password that you specified when you launched the cluster.

4. Para Schema (Esquema), escolha public (público) para criar uma tabela com base nesse esquema.

5. Insira o seguinte na janela do Query Editor e selecione Run query (Executar consulta) para criar umatabela.

create table shoes(shoetype varchar (10),color varchar(10));

6. Escolha Clear (Limpar).7. Insira o seguinte comando na janela do Query Editor e selecione Run query (Executar consulta) para

adicionar linhas à tabela.


8. Escolha Clear (Limpar).9. Insira o seguinte comando na janela do Query Editor e selecione Run query (Executar consulta) para

consultar a nova tabela.


Você deve ver os resultados a seguir.

12

Amazon Redshift Guia de conceitos básicosQuerying a database using a SQL client

Querying a database using a SQL clientDepois, você se conectará ao cluster usando uma ferramenta de cliente SQL e executará uma consultasimples para testar a conexão. Você pode usar a maioria das ferramentas do cliente SQL que sãocompatíveis com PostgreSQL. Para este tutorial, utiliza o SQL Workbench/Client. Siga as etapas a seguirpara concluir a seção:

• Install SQL client drivers and tools (p. 13)• To get your connection string (p. 14)• To connect from SQL Workbench/J to your cluster (p. 15)

Depois de concluir esta etapa, você poderá determinar se deseja carregar dados de amostra do AmazonS3 em Step 6: Load sample data from Amazon S3 (p. 17) ou ver mais informações sobre o AmazonRedshift e redefinir seu ambiente em Where do I go from here? (p. 21).

Install SQL client drivers and toolsVocê pode usar a maioria das ferramentas do cliente SQL com drivers JDBC ou ODBC do AmazonRedshift para se conectar a um cluster do Amazon Redshift. Neste tutorial, você se conecta usando o SQLWorkbench/J, uma ferramenta de consulta SQL gratuita, independente do DBMS e multiplataforma. Seplanear utilizar o SQL Workbench/J para concluir este tutorial, utilize os passos seguintes para configuraro Amazon Redshift Controlador JDBC e Workbench SQL/J. Para obter instruções mais completas parainstalar o SQL Workbench/J, aceda a Configurar o cliente da estação de trabalho SQL/J no AmazonRedshift Cluster Management Guide. Se utilizar um Amazon EC2 como o seu computador cliente, instale oSQL Workbench/J e os controladores necessários na instância.

13

https://docs.aws.amazon.com/redshift/latest/mgmt/connecting-using-workbench.html


Note

Instale por conta própria as ferramentas de banco de dados de terceiros que você deseja usarcom os clusters. O Amazon Redshift não fornece nem instala nenhuma ferramenta ou bibliotecade terceiros.

To install SQL Workbench/J on your client computer

1. Consulte a licença de software do SQL Workbench/J.2. Acesse o site do SQL Workbench/J e faça download do pacote apropriado para o seu sistema

operacional.3. Acesse a página Instalar e iniciar o SQL Workbench/J e instale o SQL Workbench/J.

Important

Veja quais são os pré-requisitos da versão do tempo de execução de Java para o SQLWorkbench/J e verifique se você está usando essa versão. Se não estiver, o aplicativo clientenão será executado.

4. Acesse Configurar uma conexão JDBC e faça download de um driver JDBC do Amazon Redshift parapermitir que o SQL Workbench/J se conecte ao cluster.

Para obter mais informações sobre como usar os drivers JDBC ou ODBC do Amazon Redshift, consulteConfigurar conexões no Amazon Redshift.

To get your connection stringPara conectar-se ao cluster com a ferramenta do cliente SQL, você precisa da string de conexão docluster. A string de conexão do cluster se encontra no console do Amazon Redshift, na página de detalhesdo cluster.

Note


New console

Para encontrar a string de conexão de um cluster


2. No menu de navegação, escolha CLUSTERS e escolha o nome do cluster na lista para abrir osdetalhes.

3. Escolha a guia Properties (Propriedades) do cluster e visualize os Connection details (Detalhes daconexão) para ver os valores de JDBC URL (URL JDBC) e ODBC URL (URL ODBC). A string deconexão é baseada na região da AWS em que o cluster é executado.

4. Escolha Copy (Copiar) para copiar a string nesta página.

Original console

Para encontrar a string de conexão de um cluster


(Configuração).

14

http://www.sql-workbench.net/manual/license.html#license-restrictions

http://www.sql-workbench.net/

http://www.sql-workbench.net/manual/install.html

https://docs.aws.amazon.com/redshift/latest/mgmt/configure-jdbc-connection.html

https://docs.aws.amazon.com/redshift/latest/mgmt/configuring-connections.html




3. Na guia Configuration (Configuração), em Cluster Database Properties (Propriedades do banco dedados do cluster), copie o URL do JDBC do cluster.

Note

O endpoint do seu cluster só será disponibilizado depois que o cluster for criado e estiver noestado disponível.

To connect from SQL Workbench/J to your clusterEsta etapa presume que você instalou o SQL Workbench/J.

1. Abra o SQL Workbench/J.2. Escolha Arquivo e depois Janela de conexão.3. Escolha Criar um novo perfil de conexão.4. Em New profile (Novo perfil), insira um nome para o perfil.5. Escolha Gerenciar drivers. A caixa de diálogo Manage Drivers (Gerenciar drivers) será aberta.6. Selecione Create a new entry (Criar uma entrada). Em Name (Nome), insira um nome para o driver.

Selecione o ícone de pasta ao lado da caixa Library (Biblioteca), navegue até o local do driver,selecione-o e selecione Open (Abrir).

15


Se a caixa de diálogo Please select one driver (Selecione um driver) for exibida, selecionecom.amazon.redshift.jdbc4.Driver ou com.amazon.redshift.jdbc41.Driver e selecione OK. O SQLWorkbench/J preenche a caixa Nome da classe automaticamente. Mantenha Sample URL (Exemplode URL) em branco e selecione OK.

7. Em Driver, escolha o driver que você acabou de adicionar.8. Em URL, copie o URL do JDBC do Amazon Redshift console e cole-o aqui.9. Em Username (Nome de usuário), insira awsuser para o usuário mestre.10. Em Password (Senha), insira a senha associada à conta de usuário mestre.11. Selecione Autocommit (Confirmar automaticamente).12. Selecione o ícone Save profile list (Salvar lista de perfis), conforme mostrado a seguir.

13. Escolha OK.

16

Amazon Redshift Guia de conceitos básicosStep 6: Load sample data

14. Insira o seguinte comando na janela de consulta e selecione SQL, Execute Current (Executar atual)para adicionar linhas à tabela.

create table shoes(shoetype varchar (10),color varchar(10));

15. Execute o comando a seguir para adicionar linhas à tabela.


16. Execute o comando a seguir para consultar a nova tabela.


Step 6: Load sample data from Amazon S3Nesse momento, você tem um banco de dados chamado dev e está conectado a ele. Então, criealgumas tabelas no banco de dados, faça upload de dados nelas e tente fazer uma consulta. Para suaconveniência, os dados de exemplo carregados ficam disponíveis em um bucket do Amazon S3.

Note

Se estiver usando uma ferramenta do cliente SQL, verifique se o cliente SQL está conectado aocluster.

Depois de concluir essa etapa, você poderá encontrar mais informações sobre o Amazon Redshift eredefinir seu ambiente em Where do I go from here? (p. 21).

Para carregar dados de exemplo

1. Crie tabelas.

Se estiver a utilizar o Amazon Redshift editor de consulta, copie individualmente e execute asseguintes declarações de tabela para criar tabelas no dev base de dados. Para obter maisinformações sobre a sintaxe, consulte CREATE TABLE, no Amazon Redshift Database DeveloperGuide.

17

https://docs.aws.amazon.com/redshift/latest/dg/r_CREATE_TABLE_NEW.html


create table users( userid integer not null distkey sortkey, username char(8), firstname varchar(30), lastname varchar(30), city varchar(30), state char(2), email varchar(100), phone char(14), likesports boolean, liketheatre boolean, likeconcerts boolean, likejazz boolean, likeclassical boolean, likeopera boolean, likerock boolean, likevegas boolean, likebroadway boolean, likemusicals boolean);

create table venue( venueid smallint not null distkey sortkey, venuename varchar(100), venuecity varchar(30), venuestate char(2), venueseats integer);

create table category( catid smallint not null distkey sortkey, catgroup varchar(10), catname varchar(10), catdesc varchar(50));

create table date( dateid smallint not null distkey sortkey, caldate date not null, day character(3) not null, week smallint not null, month character(5) not null, qtr character(5) not null, year smallint not null, holiday boolean default('N'));

create table event( eventid integer not null distkey, venueid smallint not null, catid smallint not null, dateid smallint not null sortkey, eventname varchar(200), starttime timestamp);

create table listing( listid integer not null distkey, sellerid integer not null, eventid integer not null, dateid smallint not null sortkey, numtickets smallint not null,

18


priceperticket decimal(8,2), totalprice decimal(8,2), listtime timestamp);

create table sales( salesid integer not null, listid integer not null distkey, sellerid integer not null, buyerid integer not null, eventid integer not null, dateid smallint not null sortkey, qtysold smallint not null, pricepaid decimal(8,2), commission decimal(8,2), saletime timestamp);

2. Carregue dados de amostra do Amazon S3 usando o comando COPY.

Note

Recomendamos o uso do comando COPY para carregar grandes conjuntos de dados noAmazon Redshift do Amazon S3 ou do DynamoDB. Para obter mais informações sobre asintaxe de COPY, consulte COPY, no Amazon Redshift Database Developer Guide.

Faça download do arquivo tickitdb.zip que contém os arquivos de dados de exemplo individuais.Descompacte e carregue os arquivos individuais em uma pasta tickit no bucket do Amazon S3na região da AWS. Edite os comandos COPY neste tutorial a fim de apontar para os arquivos nobucket do Amazon S3. Para obter informações sobre como gerenciar arquivos com o Amazon S3,consulte Criar e configurar um bucket do S3 no Guia do usuário do console do Amazon SimpleStorage Service.

Para carregar os dados de amostra, você deve fornecer autenticação para o seu cluster acessar oAmazon S3 em seu nome. Você pode fornecer autenticação com base em função ou autenticaçãocom base em chave. Recomendamos usar uma autenticação com base em função. Para obter maisinformações sobre ambos os tipos de autenticação, consulte CREDENTIALS, no Amazon RedshiftDatabase Developer Guide.

Nesta etapa, você fornece autenticação ao fazer referência à função do IAM que criou e anexou aocluster nas etapas anteriores.

Note

Se não tiver permissões adequadas para aceder Amazon S3, recebe a seguinte mensagemde erro ao executar o comando COPIAR: S3ServiceException: Access Denied. Paraobter informações sobre as permissões IAM para o comando COPIAR, consulte COPIAR noAmazon Redshift Database Developer Guide.

Os comandos COPY incluem um espaço reservado para o nome de recurso da Amazon (ARN) para afunção do IAM, o nome do bucket e uma região da AWS, conforme mostrado no exemplo a seguir.

copy users from 's3://<myBucket>/tickit/allusers_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter '|' region '<aws-region>';

Para autorizar o acesso usando uma função do IAM, substitua <iam-role-arn> na string doparâmetro CREDENTIALS pelo ARN da função do IAM que você criou em Step 2: Create an IAMrole (p. 2).

O comando COPY será semelhante ao exemplo a seguir.

19

https://docs.aws.amazon.com/redshift/latest/dg/r_COPY.html

samples/tickitdb.zip

https://docs.aws.amazon.com/AmazonS3/latest/user-guide/create-configure-bucket.html

https://docs.aws.amazon.com/redshift/latest/dg/copy-parameters-credentials.html

https://docs.aws.amazon.com/redshift/latest/dg/copy-usage_notes-access-permissions.html


copy users from 's3://<myBucket>/tickit/allusers_pipe.txt' credentials 'aws_iam_role=arn:aws:iam::123456789012:role/myRedshiftRole' delimiter '|' region '<aws-region>';

Para carregar os dados da amostra, substitua <myBucket>, <iam-role-arn>e <aws-region> nosseguintes comandos COPIAR com os seus valores. Se estiver a utilizar o Amazon Redshift editor deconsulta, execute individualmente os seguintes comandos.

copy users from 's3://<myBucket>/tickit/allusers_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter '|' region '<aws-region>';

copy venue from 's3://<myBucket>/tickit/venue_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter '|' region '<aws-region>';

copy category from 's3://<myBucket>/tickit/category_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter '|' region '<aws-region>';

copy date from 's3://<myBucket>/tickit/date2008_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter '|' region '<aws-region>';

copy event from 's3://<myBucket>/tickit/allevents_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter '|' timeformat 'YYYY-MM-DD HH:MI:SS' region '<aws-region>';

copy listing from 's3://<myBucket>/tickit/listings_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter '|' region '<aws-region>';

copy sales from 's3://<myBucket>/tickit/sales_tab.txt'credentials 'aws_iam_role=<iam-role-arn>'delimiter '\t' timeformat 'MM/DD/YYYY HH:MI:SS' region '<aws-region>';

3. Agora teste os exemplos de consulta. Para mais informações, consulte SELECIONAR no AmazonRedshift Developer Guide.

-- Get definition for the sales table.SELECT * FROM pg_table_def WHERE tablename = 'sales';

-- Find total sales on a given calendar date.SELECT sum(qtysold) FROM sales, date WHERE sales.dateid = date.dateid AND caldate = '2008-01-05';

-- Find top 10 buyers by quantity.SELECT firstname, lastname, total_quantity FROM (SELECT buyerid, sum(qtysold) total_quantity FROM sales

20

https://docs.aws.amazon.com/redshift/latest/dg/r_SELECT_synopsis.html

Amazon Redshift Guia de conceitos básicosStep 7: Find additional resources

and reset your environment

GROUP BY buyerid ORDER BY total_quantity desc limit 10) Q, usersWHERE Q.buyerid = useridORDER BY Q.total_quantity desc;

-- Find events in the 99.9 percentile in terms of all time gross sales.SELECT eventname, total_price FROM (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile FROM (SELECT eventid, sum(pricepaid) total_price FROM sales GROUP BY eventid)) Q, event E WHERE Q.eventid = E.eventid AND percentile = 1ORDER BY total_price desc;

Step 7: Find additional resources and reset yourenvironment

Quando você concluir este tutorial, poderá acessar outros recursos do Amazon Redshift para saber maissobre os conceitos apresentados neste guia. Você também pode redefinir o ambiente para o estadoanterior. Se você pretende testar tarefas em outros guias do Amazon Redshift, convém manter o exemplode cluster em execução. Contudo, lembre-se que you continue to be charged for your cluster as long asit is running. Para parar de incorrer nas despesas, revogar o acesso ao grupo e eliminá-lo quando já nãoprecisar dela.

Where do I go from here?Additional resourcesRecomendamos que você continue aprendendo sobre os conceitos apresentados neste guia com osseguintes recursos:

• Amazon Redshift management overview: This topic provides an overview of Amazon Redshift.• Amazon Redshift Cluster Management Guide: This guide builds upon this Conceitos básicos do Amazon

Redshift and provides in-depth information about the concepts and tasks for creating, managing, andmonitoring clusters.

• Amazon Redshift Database Developer Guide: This guide builds upon this Conceitos básicos do AmazonRedshift by providing in-depth information for database developers about designing, building, querying,and maintaining the databases that make up your data warehouse.

Resetting your environmentNote


New console

Ao concluir este tutorial, redefina seu ambiente para o estado anterior excluindo o cluster de exemplo. Youcontinue to incur charges for the Amazon Redshift service until you delete the cluster.

21

https://docs.aws.amazon.com/redshift/latest/mgmt/overview.html

https://docs.aws.amazon.com/redshift/latest/mgmt/

https://docs.aws.amazon.com/redshift/latest/dg/

Amazon Redshift Guia de conceitos básicosWhere do I go from here?

Para excluir um cluster:


2. No menu de navegação, escolha CLUSTERS para exibir sua lista de clusters.3. Escolha o cluster examplecluster. Em Actions, selecione Delete. A página Delete cluster (Excluir

cluster) é exibida.4. Confirme o cluster a ser excluído e escolha Delete cluster (Excluir cluster).

Na página da lista de clusters, o status do cluster é atualizado uma vez que o cluster está excluído.

Original console

Quando você concluir este tutorial, deverá redefinir seu ambiente para o estado anterior fazendo oseguinte:

• Revoke access to the port and CIDR/IP address for which you authorized access:

If you used the EC2-VPC platform to launch your cluster, perform the steps in To revoke access from theVPC security group (p. 22).

• Delete your sample cluster. You continue to incur charges for the Amazon Redshift service until youdelete the cluster. Perform the steps in To delete the sample cluster (p. 23).

To revoke access from the VPC security group

1. No console do Amazon Redshift, no painel de navegação, selecione Clusters.2. Selecione examplecluster para abri-lo e verifique se você está na guia Configuration (Configuração).3. Em Cluster Properties (Propriedades do cluster), escolha o security group daa VPC.

4. Com o grupo de segurança padrão selecionado, escolha a guia Inbound e depois escolha Edit.

5. Exclua a regra de entrada personalizada de TCP/IP que você criou para a sua porta e o CIDR/endereço IP 0.0.0.0/0. Não remova nenhuma outra regra, como a regra Todo o tráfego que foi criadapara o grupo de segurança por padrão. Selecione Save (Salvar).

22




To delete the sample cluster


(Configuração).3. No menu Cluster, escolha Excluir.

4. Na janela Delete Cluster (Excluir cluster), para Create snapshot (Criar snapshot), escolha No (Não) edepois Delete (Excluir).

5. Na janela de detalhes do cluster, o Cluster Status (Status do cluster) mostra que ele está sendoexcluído.

23


24


Histórico do documentoA tabela a seguir descreve as alterações importantes desde a última versão do Guia de conceitos básicosdo Amazon Redshift.

Última atualização da documentação: 11 de novembro de 2019

Alteração Descrição Data de lançamento

Novo console O guia foi atualizado para descrever o novo console doAmazon Redshift.

11 de novembro de2019

Novo recurso Atualização do guia para descrever o procedimento decluster para início rápido.

10 de agosto de2018

Novo recurso Atualização do guia para executar clusters do painel doAmazon Redshift.

28 de julho de 2015

Novo recurso Atualização do guia para usar os nomes do novo tipo denó.

9 de junho de 2015

Atualização dadocumentação

Atualização das capturas de tela e do procedimento paraconfigurar grupos de segurança de VPC.

30 de abril de 2015


Atualização das capturas de tela e dos procedimentos decorrespondência do console atual.

12 de novembro de2014


Os dados de carregamento foram movidos dasinformações do Amazon S3 para a sua própria seção, ea seção de próximas etapas foi movida para a etapa finalcom o intuito de melhorar a capacidade de descoberta.

13 de maio de 2014


A página de boas-vindas foi removida, e o conteúdo foiincorporado à página principal de Conceitos básicos.

14 de março de2014


Esta é uma nova versão do Guia de conceitos básicos doAmazon Redshift que aborda o feedback do cliente e asatualizações de serviço.

14 de março de2014

Novo guia Esta é a primeira versão do Guia de conceitos básicos doAmazon Redshift.

14 de fevereiro de2013

25


Se fornecermos uma tradução da versão em inglês do guia, a versão em inglês prevalecerá caso hajaqualquer conflito entre as versões. A tradução é fornecida com o uso de tradução por máquina.

xxvi

amazon redshift - guia de conceitos básicos...amazon redshift guia de conceitos básicos etapa 3:...

Documents