Como usar o bash no google colab?

Paulo Henrique Oliveira
3 min readJan 1, 2021

--

O Google Colab é uma ótima ferramenta para executar códigos Python para aprendizado de máquina e mineração de dados no navegador.

No entanto, o Google Colab (e o Jupyter Notebook) oferecem um pouco mais do que apenas executar códigos Python. Você pode fazer muito mais coisas se puder usar comandos de terminal apropriados e magias de linha, junto com o código Python.

Se você está procurando uma maneira interativa de executar seu script Python, digamos que deseja iniciar um projeto de aprendizado de máquina com alguns amigos, não procure mais — o Google Colab é a melhor solução para você.

Você pode trabalhar online e salvar seu código no Google Drive local, e isso permite que você

  • Execute seus scripts com GPUs (e TPUs!) Gratuitas
  • Utilize bibliotecas Python pré-instaladas e recursos do Jupyter Notebook
  • Trabalhe onde quiser, é nas nuvens
  • Compartilhe códigos e colabore com colegas

Magias de linha integradas (%) e !comand

Não faz muito tempo, eu estava tendo dificuldades para mudar de diretório e mover arquivos no colab. Era porque eu não sabia a diferença entre% e!

Existem muitas diferenças nas funcionalidades, mas a principal diferença é que as alterações feitas por magics de linha integrados (%) são aplicadas a todo o ambiente do notebook. Em contraste,! O comand é aplicável apenas ao subshell que está executando o comando.

É mais fácil entender com exemplos. Por exemplo, se eu quiser mover para um subdiretório sample_data. Se eu usar o comand! Cd para mover para o subdiretório e imprimir o diretório atual com pwd, isso mostra que ainda estou no diretório de conteúdo.

Alterando diretórios atuais

Portanto, acabamos de ver como alterar os diretórios atuais e imprimir os diretórios e subdiretórios atuais. Eles não são usados apenas no Colab, mas também são usados com frequência em terminais Ubuntu e MacOSX. Para resumir,

  • O comando! pwd encontra o diretório atualmente em funcionamento
  • O comando! ls descobre os subdiretórios atuais
  • % cd directory_to_move line magic move o diretório de trabalho atual.
  • Buscando e descompactando arquivos da web

Às vezes, queremos fazer download e abrir arquivos, por exemplo, conjuntos de dados, da web. Nesses casos, podemos usar o comando! Wget.

  • ! wget url_to_the_file

Além disso, se quiser descompactar esses arquivos, você pode usar os comandos! Unzip ou! Gunzip.

! unzip funciona com a maioria dos arquivos compactados convencionais, por exemplo, arquivos .zip, e gunzip funciona com arquivos .gz ou .tgz.

Magias de linha padrão

Existem algumas magias de linha “padrão” que muitas pessoas simplesmente executam automaticamente antes de executar outras células nos Notebooks Colab ou Jupyter.

  • % matplotlib inline: garante que todos os gráficos matplotlib sejam mostrados na célula de saída e sejam mantidos no bloco de notas quando salvos.
  • % reload_ext autoreload,% autoreload 2: recarrega todos os módulos antes de executar uma nova linha. Portanto, quando um módulo é atualizado, você não precisa executar novamente o comando de importação.

% matplotlib inline

% reload_ext autoreload

% autoreload 2

Para uma lista abrangente de magias de linha e célula, consulte a documentação do IPython. Siga as informações mencionadas para abranger Curtiu conhecer mais sobre o mundo Open-source? Acompanhe o blog Semana do Linux.

Artigo originalmente publicado em: https://coletivo.semanadolinux.com.br/blog/como-usar-o-bash-no-google-colab

--

--

Paulo Henrique Oliveira
Paulo Henrique Oliveira

Written by Paulo Henrique Oliveira

Empresário do ramo de tecnologia há mais de 20 anos, líder em consultoria, serviços e soluções baseadas na plataforma Linux.

No responses yet