Bem-vindo ao Comprehensive Rust 🩀

Workflow do GitHub ContribuiçÔes no GitHub Estrelas no GitHub

Este Ă© um curso gratuito de Rust desenvolvido pela equipe do Android no Google. O curso abrange o espectro completo da linguagem, desde sintaxe bĂĄsica atĂ© tĂłpicos avançados como ‘generics’ e tratamento de erros.

O objetivo do curso Ă© ensinar Rust a vocĂȘ. NĂłs assumimos que vocĂȘ nĂŁo saiba nada sobre Rust e esperamos:

  • Dar a vocĂȘ uma compreensĂŁo abrangente da linguagem e da sintaxe de Rust.
  • Permitir que vocĂȘ modifique programas existentes e escreva novos programas em Rust.
  • Demonstrar expressĂ”es idiomĂĄticas comuns de Rust.

NĂłs chamamos os trĂȘs primeiros dias do curso de Fundamentos do Rust.

Em seguida, vocĂȘ estĂĄ convidado(a) a mergulhar a fundo em um ou mais tĂłpicos especializados:

  • Android: um curso de meio dia sobre a utilização de Rust no desenvolvimento para a plataforma Android (AOSP). Isto inclui interoperabilidade com C, C++ e Java.
  • Bare-metal: uma aula de um dia sobre a utilização de Rust para o desenvolvimento “bare metal” (sistema embarcado). Tanto micro-controladores quanto processadores de aplicação sĂŁo cobertos.
  • ConcorrĂȘncia: uma aula de um dia inteiro sobre concorrĂȘncia em Rust. NĂłs cobrimos tanto concorrĂȘncia clĂĄssica (escalonamento preemptivo utilizando threads e mutexes) quanto concorrĂȘncia async/await (multitarefa cooperativa utilizando futures).

Fora do escopo

Rust Ă© uma linguagem extensa e nĂŁo conseguiremos cobrir tudo em poucos dias. Alguns assuntos que nĂŁo sĂŁo objetivos deste curso sĂŁo:

Premissas

O curso pressupĂ”e que vocĂȘ jĂĄ saiba programar. Rust Ă© uma linguagem de tipagem estĂĄtica e ocasionalmente faremos comparaçÔes com C e C++ para melhor explicar ou contrastar a abordagem do Rust.

Se vocĂȘ sabe programar em uma linguagem de tipagem dinĂąmica, como Python ou JavaScript, entĂŁo vocĂȘ tambĂ©m serĂĄ capaz de acompanhar.

Este é um exemplo de uma nota do instrutor. Nós as usaremos para adicionar informaçÔes complementares aos slides. Elas podem ser tanto pontos-chave que o instrutor deve cobrir quanto respostas a perguntas típicas que surgem em sala de aula.

Conduzindo o Curso

Esta pĂĄgina Ă© para o instrutor do curso.

Aqui estão algumas informaçÔes båsicas sobre como estamos conduzindo o curso internamente no Google.

Antes de oferecer o curso, vocĂȘ precisa:

  1. Familiarize-se com o material do curso. IncluĂ­mos notas do instrutor para ajudar a destacar os pontos principais (ajude-nos contribuindo com mais notas!). Ao apresentar, certifique-se de abrir as notas do instrutor em um pop-up (clique no link com uma pequena seta ao lado de “Speaker Notes” ou “Notas do Instrutor”). Desta forma vocĂȘ tem uma tela limpa para apresentar Ă  turma.

  2. Decida as datas. Como o curso leva pelo menos trĂȘs dias completos, recomendamos que vocĂȘ agende os dias ao longo de duas semanas. Os participantes do curso disseram que eles acham Ăștil ter uma lacuna no curso, pois os ajuda a processar todas as informaçÔes que lhes damos.

  3. Encontre uma sala grande o suficiente para seus participantes presenciais. Recomendamos turmas de 15 a 25 pessoas. Isso Ă© pequeno o suficiente para que as pessoas se sintam confortĂĄveis fazendo perguntas — tambĂ©m Ă© pequeno o suficiente para que um instrutor tenha tempo para responder Ă s perguntas. Certifique-se de que a sala tenha mesas para vocĂȘ e para os alunos: todos vocĂȘs precisam ser capazes de sentar e trabalhar com seus laptops. Em particular, vocĂȘ farĂĄ muita codificação ao vivo como instrutor, portanto, um pĂłdio nĂŁo serĂĄ muito Ăștil para vocĂȘ.

  4. No dia do seu curso, chegue um pouco mais cedo na sala para acertar as coisas. Recomendamos apresentar diretamente usando mdbook serve rodando em seu laptop (consulte as instruçÔes de instalação). Isso garante um desempenho ideal sem atrasos conforme vocĂȘ muda de pĂĄgina. Usar seu laptop tambĂ©m permitirĂĄ que vocĂȘ corrija erros de digitação enquanto vocĂȘ ou os participantes do curso os identificam.

  5. Deixe as pessoas resolverem os exercĂ­cios sozinhas ou em pequenos grupos. Normalmente gastamos de 30 a 45 minutos em exercĂ­cios pela manhĂŁ e Ă  tarde (incluindo o tempo para revisar as soluçÔes). Tenha certeza de perguntar Ă s pessoas se elas estĂŁo em dificuldades ou se hĂĄ algo em que vocĂȘ possa ajudar. Quando vocĂȘ vir que vĂĄrias pessoas tĂȘm o mesmo problema, chame a turma e ofereça uma solução, por exemplo, mostrando Ă s pessoas onde encontrar as informaçÔes relevantes na biblioteca padrĂŁo (“standard library”).

Isso Ă© tudo, boa sorte no curso! Esperamos que seja tĂŁo divertido para vocĂȘ como tem sido para nĂłs!

Por favor, dĂȘ seu feedback depois para que possamos continuar melhorando o curso. AdorarĂ­amos saber o que funcionou bem para vocĂȘ e o que pode ser melhorado. Seus alunos tambĂ©m sĂŁo muito bem-vindos para nos enviar feedback!

Estrutura do Curso

Esta pĂĄgina Ă© para o instrutor do curso.

O curso Ă© rĂĄpido e muito abrangente:

  • Day 1: Basic Rust, syntax, control flow, creating and consuming values.
  • Day 2: Memory management, ownership, compound data types, and the standard library.
  • Day 3: Generics, traits, error handling, testing, and unsafe Rust.

AnĂĄlises Detalhadas

Além do curso de 3 dias sobre fundamentos de Rust, nós abordamos alguns tópicos mais especializados:

Rust in Android

The Rust in Android deep dive is a half-day course on using Rust for Android platform development. This includes interoperability with C, C++, and Java.

VocĂȘ precisarĂĄ de um checkout do AOSP. Faça um checkout do repositĂłrio do curso no mesmo computador e mova o diretĂłrio src/android/ para a raiz do seu checkout do AOSP. Isso garantirĂĄ que o sistema de compilação do Android veja os arquivos Android.bp em src/android/.

Certifique-se de que adb sync funcione com seu emulador ou dispositivo fĂ­sico e prĂ©-compile todos os exemplos do Android usando src/android/build_all.sh. Leia o roteiro para ver os comandos executados e verifique se eles funcionam quando vocĂȘ os executa manualmente.

Bare-Metal Rust

The Bare-Metal Rust deep dive is a full day class on using Rust for bare-metal (embedded) development. Both microcontrollers and application processors are covered.

Para a parte do micro-controlador, vocĂȘ precisarĂĄ comprar a placa de desenvolvimento BBC micro:bit v2 com antecedĂȘncia. Todos precisarĂŁo instalar vĂĄrios pacotes, conforme descrito na pĂĄgina inicial.

Concurrency in Rust

The Concurrency in Rust deep dive is a full day class on classical as well as async/await concurrency.

VocĂȘ precisarĂĄ de um novo crate configurado e as dependĂȘncias baixadas e prontas para uso. VocĂȘ pode entĂŁo copiar/colar os exemplos para src/main.rs para experimentĂĄ-los:

cargo init concurrency
cd concurrency
cargo add tokio --features full
cargo run

Formato

O curso foi projetado para ser bastante interativo e recomendamos deixar as perguntas conduzirem a exploração de Rust!

Atalhos de Teclado

Existem vĂĄrios atalhos de teclado Ășteis no mdBook:

  • Seta para a esquerda: Vai para a pĂĄgina anterior.
  • Seta para a direita: Vai para a prĂłxima pĂĄgina.
  • Ctrl + Enter: Executa o exemplo de cĂłdigo que tem o foco.
  • S: Ativa a barra de pesquisa.

TraduçÔes

O curso foi traduzido para outros idiomas por um grupo de voluntĂĄrios maravilhosos:

Use o seletor de idioma no canto superior direito para alternar entre os idiomas.

TraduçÔes Incompletas

HĂĄ um grande nĂșmero de traduçÔes em andamento. NĂłs referenciamos as traduçÔes mais recentemente atualizadas:

Se vocĂȘ quiser ajudar com esse esforço, consulte nossas instruçÔes sobre como proceder. As traduçÔes sĂŁo coordenadas no issue tracker.

Usando o Cargo

Quando vocĂȘ começar a ler sobre Rust, logo conhecerĂĄ o Cargo, a ferramenta padrĂŁo usada no ecossistema Rust para criar e executar aplicativos Rust. Aqui nĂłs queremos dar uma breve visĂŁo geral do que Ă© o Cargo e como ele se encaixa no ecossistema mais amplo e como ele se encaixa neste treinamento.

Instalação

Por favor, siga as instruçÔes em https://rustup.rs/.

Isso fornecerĂĄ a ferramenta de compilação Cargo (cargo) e o compilador Rust (rustc). VocĂȘ tambĂ©m obterĂĄ o rustup, um utilitĂĄrio de linha de comando que vocĂȘ pode usar para instalar/alternar ferramentas, configurar compilação cruzada, etc.

  • No Debian/Ubuntu, vocĂȘ tambĂ©m pode instalar o Cargo, o cĂłdigo-fonte do Rust e o formatador Rust com apt. Entretanto, isto lhe fornece uma versĂŁo desatualizada do Rust e pode levar a comportamentos inesperados. O comando seria:
sudo apt install cargo rust-src rustfmt
  • NĂłs sugerimos a utilização do VS Code para editar o cĂłdigo (mas qualquer editor LSP - Language Server Protocol - funciona com o rust-analyzer3).

  • Algumas pessoas tambĂ©m gostam de usar a famĂ­lia de IDEs JetBrains, que fazem suas prĂłprias anĂĄlises, mas tĂȘm suas prĂłprias vantagens e desvantagens. Se vocĂȘ preferi-las, pode instalar o Plugin Rust. Observe que, a partir de Janeiro de 2023, a depuração funciona apenas na versĂŁo CLion do pacote JetBrains IDEA.

O ecossistema do Rust

O ecossistema Rust consiste em vĂĄrias ferramentas, das quais as principais sĂŁo:

  • rustc: o compilador Rust que converte arquivos .rs em binĂĄrios e outros formatos intermediĂĄrios.

  • cargo: o gerenciador de dependĂȘncias e ferramenta de compilação do Rust. O Cargo sabe como baixar dependĂȘncias, normalmente hospedadas em https://crates.io, e as passarĂĄ para o rustc quando compilar o seu projeto. O Cargo tambĂ©m vem com um gerenciador de testes embutido que Ă© utilizado para a execução de testes unitĂĄrios.

  • rustup: o instalador e atualizador do conjunto de ferramentas do Rust. Esta ferramenta Ă© utilizada para instalar e atualizar o rustc e o cargo quando novas versĂ”es do Rust forem lançadas. AlĂ©m disso, rustup tambĂ©m pode baixar a documentação da biblioteca padrĂŁo. VocĂȘ pode ter mĂșltiplas versĂ”es do Rust instaladas ao mesmo tempo e rustup permitirĂĄ que vocĂȘ alterne entre elas conforme necessĂĄrio.

Pontos chave:

  • O Rust tem um cronograma de lançamento rĂĄpido com um novo lançamento saindo a cada seis semanas. Novos lançamentos mantĂȘm compatibilidade com versĂ”es anteriores — alĂ©m disso, eles habilitam novas funcionalidades.

  • Existem trĂȘs canais de lançamento: “stable”, “beta” e “nightly”.

  • Novos recursos estĂŁo sendo testados em “nightly”, “beta” Ă© o que se torna “stable” a cada seis semanas.

  • DependĂȘncias tambĂ©m podem ser resolvidas a partir de registros alternativos, git, pastas, e outros mais.

  • O Rust tambĂ©m tem ediçÔes: a edição atual Ă© o Rust 2021. As ediçÔes anteriores foram o Rust 2015 e o Rust 2018.

    • As ediçÔes podem fazer alteraçÔes incompatĂ­veis com versĂ”es anteriores da linguagem.

    • Para evitar quebra de cĂłdigo, as ediçÔes sĂŁo opcionais: vocĂȘ seleciona a edição para o seu crate atravĂ©s do arquivo Cargo.toml.

    • Para evitar a divisĂŁo do ecossistema, os compiladores Rust podem misturar cĂłdigo escrito para diferentes ediçÔes.

    • Mencione que Ă© muito raro usar o compilador diretamente, nĂŁo atravĂ©s do cargo (a maioria dos usuĂĄrios nunca o faz).

    • Pode valer a pena mencionar que o prĂłprio Cargo Ă© uma ferramenta extremamente poderosa e abrangente. Ele Ă© capaz de muitos recursos avançados, incluindo, entre outros:

    • Leia mais no livro oficial do Cargo

Exemplos de CĂłdigo neste Treinamento

Para este treinamento, exploraremos principalmente a linguagem Rust por meio de exemplos que podem ser executados atravĂ©s do seu navegador. Isso torna a instalação muito mais fĂĄcil e garante uma experiĂȘncia consistente para todos.

A instalação do Cargo ainda assim Ă© incentivada: serĂĄ mais fĂĄcil para vocĂȘ fazer os exercĂ­cios. No Ășltimo dia, faremos um exercĂ­cio maior que mostra como trabalhar com dependĂȘncias e para isso vocĂȘ precisarĂĄ do Cargo.

Os blocos de cĂłdigo neste curso sĂŁo totalmente interativos:

fn main() {
    println!("Edite-me!");
}

VocĂȘ pode usar Ctrl + Enter to execute the code when focus is in the text box.

A maioria dos exemplos de cĂłdigo sĂŁo editĂĄveis, como mostrado acima. Alguns exemplos de cĂłdigo nĂŁo sĂŁo editĂĄveis por vĂĄrios motivos:

  • Os playgrounds embutidos nĂŁo conseguem executar testes unitĂĄrios. Copie o cĂłdigo e cole no Playground real para demonstrar os testes unitĂĄrios.

  • Os playgrounds embutidos perdem seu estado no momento em que vocĂȘ navega para outra pĂĄgina! Esta Ă© a razĂŁo pela qual os alunos devem resolver os exercĂ­cios usando uma instalação do Rust local ou via Playground real.

Executando CĂłdigo Localmente com o Cargo

Se vocĂȘ quiser experimentar o cĂłdigo em seu prĂłprio sistema, precisarĂĄ primeiro instalar o Rust. Faça isso seguindo as instruçÔes no Livro do Rust. Isso deve fornecer o rustc e o cargo funcionando. Quando este curso foi escrito, as Ășltimas versĂ”es estĂĄveis do Rust sĂŁo:

% rustc --version
rustc 1.69.0 (84c898d65 2023-04-16)
% cargo --version
cargo 1.69.0 (6e9a83356 2023-04-12)

VocĂȘ tambĂ©m pode usar qualquer versĂŁo posterior, pois o Rust mantĂ©m compatibilidade com versĂ”es anteriores.

Com isso finalizado, siga estas etapas para criar um binĂĄrio Rust a partir de um dos exemplos deste treinamento:

  1. Clique no botĂŁo “Copy to clipboard” (“Copiar para a ĂĄrea de transferĂȘncia”) no exemplo que deseja copiar.

  2. Use cargo new exercise para criar um novo diretĂłrio exercise/ para o seu cĂłdigo:

    $ cargo new exercise
         Created binary (application) `exercise` package
    
  3. Navegue até exercise/ e use cargo run para compilar e executar seu binårio:

    $ cd exercise
    $ cargo run
       Compiling exercise v0.1.0 (/home/mgeisler/tmp/exercise)
        Finished dev [unoptimized + debuginfo] target(s) in 0.75s
         Running `target/debug/exercise`
    Hello, world!
    
  4. Substitua o código gerado em src/main.rs pelo seu próprio código. Por exemplo, usando o exemplo da pågina anterior, faça src/main.rs parecer como

    fn main() {
        println!("Edite-me!");
    }
  5. Use cargo run para compilar e executar seu binĂĄrio atualizado:

    $ cargo run
       Compiling exercise v0.1.0 (/home/mgeisler/tmp/exercise)
        Finished dev [unoptimized + debuginfo] target(s) in 0.24s
         Running `target/debug/exercise`
    Edit me!
    
  6. Use cargo check para verificar rapidamente se hĂĄ erros em seu projeto, use cargo build para compilĂĄ-lo sem executĂĄ-lo. VocĂȘ encontrarĂĄ a saĂ­da em target/debug/ para uma compilação de depuração normal. Use cargo build --release para produzir um binĂĄrio otimizado em target/release/.

  7. VocĂȘ pode adicionar dependĂȘncias para seu projeto editando Cargo.toml. Quando vocĂȘ execute os comandos cargo, ele irĂĄ baixar e compilar automaticamente dependĂȘncias para vocĂȘ.

Tente encorajar os participantes do curso a instalar o Cargo e usar um editor local. Isso facilitarĂĄ a vida deles, pois eles terĂŁo um ambiente normal de desenvolvimento.

Bem-vindo ao Dia 1

Este Ă© o primeiro dia de Fundamentos do Rust. NĂłs iremos cobrir muitos pontos hoje:

  • Sintaxe Rust bĂĄsica: variĂĄveis, tipos escalares e compostos, enums, structs, referĂȘncias, funçÔes e mĂ©todos.

  • Construtos de fluxo de controle: if, if let, while, while let, break, e continue.

  • CorrespondĂȘncia de padrĂ”es: desestruturando enums, structs, e arrays.

Lembre aos alunos que:

  • Eles devem fazer perguntas na hora, nĂŁo as guarde para o fim.
  • A aula Ă© para ser interativa e as discussĂ”es sĂŁo muito encorajadas!
    • Como instrutor, vocĂȘ deve tentar manter as discussĂ”es relevantes, ou seja, mantenha as discussĂ”es relacionadas a como o Rust faz as coisas versus alguma outra linguagem. Pode ser difĂ­cil encontrar o equilĂ­brio certo, mas procure permitir mais discussĂ”es, uma vez que elas engajam as pessoas muito mais do que uma comunicação unidirecional.
  • As perguntas provavelmente farĂŁo com que falemos sobre coisas antes dos slides.
    • Isso estĂĄ perfeitamente OK! A repetição Ă© uma parte importante do aprendizado. Lembre-se que os slides sĂŁo apenas um suporte e vocĂȘ estĂĄ livre para ignorĂĄ-los quando quiser.

A ideia para o primeiro dia é mostrar apenas o suficiente de Rust para poder falar sobre o famoso borrow checker (verificador de empréstimos). A maneira como o Rust lida com a memória é uma característica importante e devemos mostrar isso aos alunos imediatamente.

Se vocĂȘ estiver ensinando isso em uma sala de aula, este Ă© um bom lugar para repassar o cronograma. Sugerimos dividir o dia em duas partes (seguindo os slides):

  • ManhĂŁ: 9h Ă s 12h,
  • Tarde: 13h Ă s 16h.

É claro que vocĂȘ pode ajustar isso conforme necessĂĄrio. Certifique-se de incluir pausas, recomendamos uma a cada hora!

O que Ă© Rust?

Rust é uma nova linguagem de programação que teve sua versão 1.0 lançada em 2015:

  • Rust Ă© uma linguagem compilada estaticamente e tem um papel semelhante ao C++
    • rustc usa o LLVM como back-end.
  • Rust suporta muitas plataformas e arquiteturas:
    • x86, ARM, WebAssembly, 

    • Linux, Mac, Windows, 

  • Rust Ă© usado em uma ampla gama de dispositivos:
    • firmware e carregadores de boot,
    • monitores inteligentes,
    • celulares,
    • desktops,
    • servidores.

Rust se encaixa na mesma ĂĄrea que C++:

  • Alta flexibilidade.
  • Alto nĂ­vel de controle.
  • Pode ser reduzido para dispositivos com menor poder computacional, tais como microcontroladores.
  • NĂŁo possui runtime ou coletor de lixo (garbage collection).
  • Concentra-se em confiabilidade e segurança sem sacrificar o desempenho.

OlĂĄ Mundo!

Vamos pular para o programa em Rust mais simples possível, o clássico “Olá Mundo”:

fn main() {
    println!("Olá, 🌍!");
}

O que vocĂȘ vĂȘ:

  • FunçÔes sĂŁo introduzidas com fn.
  • Os blocos sĂŁo delimitados por chaves como em C e C++.
  • A função main Ă© o ponto de entrada do programa.
  • Rust tem macros “higiĂȘnicas”, println! Ă© um exemplo disso.
  • As strings Rust sĂŁo codificadas em UTF-8 e podem conter qualquer caractere Unicode.

Este slide tenta deixar os alunos familiarizados com o cĂłdigo em Rust. Eles irĂŁo ver bastante conteĂșdo nos prĂłximos trĂȘs dias, entĂŁo começamos devagar com algo familiar.

Pontos chave:

  • Rust Ă© muito parecido com outras linguagens na tradição C/C++/Java. É imperativo (nĂŁo funcional) e nĂŁo tenta reinventar as coisas, a menos que seja absolutamente necessĂĄrio.

  • Rust Ă© moderno com suporte total para coisas como Unicode.

  • Rust usa macros para situaçÔes em que vocĂȘ deseja ter um nĂșmero variĂĄvel de argumentos (sem sobrecarga de função).

  • Macros “higiĂȘnicas” significam que elas nĂŁo capturam acidentalmente identificadores do escopo em que sĂŁo usadas. As macros em Rust sĂŁo, na verdade, apenas parcialmente “higiĂȘnicas”.

  • Rust Ă© multi-paradigma. Por exemplo, ele possui funcionalidades de programação orientada Ă  objetos poderosas, e, embora nĂŁo seja uma linguagem funcional, inclui uma sĂ©rie de conceitos funcionais.

Um Pequeno Exemplo

Aqui estĂĄ um pequeno programa de exemplo em Rust:

fn main() {              // Ponto de entrada do programa
    let mut x: i32 = 6;  // Atribuição de uma variåvel mutåvel
    print!("{x}");       // Macro para escrever na tela, como printf
    while x != 1 {       // Sem parĂȘnteses ao redor de expressĂ”es
        if x % 2 == 0 {  // MatemĂĄtica como em outras linguagens
            x = x / 2;
        } else {
            x = 3 * x + 1;
        }
        print!(" -> {x}");
    }
    println!();
}

O cĂłdigo implementa a conjectura de Collatz: acredita-se que o loop sempre termina, mas isso ainda nĂŁo estĂĄ provado. Edite o cĂłdigo e tente diferentes entradas.

Pontos chave:

  • Explique que todas as variĂĄveis tipadas estaticamente. Tente remover i32 para acionar a inferĂȘncia de tipo. Em vez disso, tente com i8 e cause um estouro de nĂșmero inteiro (integer overflow) em tempo de execução.

  • Altere let mut x para let x, discuta o erro do compilador.

  • Mostre como print! cause um erro de compilação se os argumentos nĂŁo corresponderem Ă  string de formato.

  • Mostre como vocĂȘ precisa usar {} como um espaço reservado se quiser imprimir uma expressĂŁo que seja mais complexa do que apenas uma Ășnica variĂĄvel.

  • Mostre aos alunos a biblioteca padrĂŁo (standard library), mostre como pesquisar std::fmt, o qual possui as regras da mini-linguagem de formatação. É importante que os alunos se familiarizem com pesquisas na biblioteca padrĂŁo.

    • Em um shell rustup doc std::fmt abrirĂĄ um navegador na documentação std::fmt local.

Por que Rust?

Alguns pontos exclusivos do Rust:

  • Segurança de memĂłria em tempo de compilação.
  • Sem comportamento indefinido em tempo de execução.
  • Recursos de linguagem de programação modernas.

Certifique-se de perguntar Ă  classe com quais linguagens de programação eles tĂȘm experiĂȘncia. Dependendo da resposta vocĂȘ pode destacar diferentes caracterĂ­sticas do Rust:

  • ExperiĂȘncia com C ou C++: Rust elimina toda uma classe de erros em tempo de execução atravĂ©s do verificador de emprĂ©stimos (borrow checker). VocĂȘ obtĂ©m desempenho como em C e C++, mas sem os problemas de insegurança de memĂłria. AlĂ©m disso, vocĂȘ tem uma linguagem com funcionalidades modernas como correspondĂȘncia de padrĂ”es e gerenciamento de dependĂȘncia integrado.

  • ExperiĂȘncia com Java, Go, Python, JavaScript
: VocĂȘ tem a mesma segurança de memĂłria como nessas linguagens, alĂ©m de uma semelhança com linguagens de alto nĂ­vel. AlĂ©m disso vocĂȘ obtĂ©m desempenho rĂĄpido e previsĂ­vel como C e C++ (sem coletor de lixo ou “garbage collector”) bem como acesso a hardware de baixo nĂ­vel (caso vocĂȘ precise)

Garantias em Tempo de Compilação

Gerenciamento de memória eståtica em tempo de compilação:

  • Sem variĂĄveis nĂŁo inicializadas.
  • Sem vazamentos de memĂłria (quase, veja as notas).
  • Sem double-frees.
  • Sem use-after-free.
  • Sem ponteiros NULL.
  • Sem mutexes bloqueados esquecidos.
  • Sem concorrĂȘncia de dados entre threads.
  • Sem invalidação de iteradores.

É possível produzir vazamentos de memória no Rust (seguro). Alguns exemplos são:

  • VocĂȘ pode usar Box::leak para vazar um ponteiro. Um uso para isso poderia ser para obter variĂĄveis estĂĄticas inicializadas e dimensionadas em tempo de execução
  • VocĂȘ pode usar std::mem::forget para fazer o compilador “esquecer” sobre um valor (o que significa que o destrutor nunca Ă© executado).
  • VocĂȘ tambĂ©m pode criar acidentalmente uma referĂȘncia cĂ­clica com Rc ou Arc.
  • Na verdade, alguns considerarĂŁo que preencher infinitamente uma coleção (estruturas de dados) seja um vazamento de memĂłria e o Rust nĂŁo protege disso.

Para o propósito deste curso, “Sem vazamentos de memória” deve ser entendido como “Praticamente sem vazamentos de memória acidentais”.

Garantias em Tempo de Execução

Nenhum comportamento indefinido em tempo de execução:

  • O acesso a matrizes tem limites verificados.
  • Estouro de nĂșmeros inteiros Ă© definido (“pĂąnico” ou wrap-around).

Pontos chave:

  • O estouro de nĂșmeros inteiros Ă© definido por meio da flag overflow-checks em tempo de compilação. Se habilitada, o programa causarĂĄ um pĂąnico (uma falha controlada do programa). Caso contrĂĄrio, serĂĄ usada a semĂąntica wrap-around. Por padrĂŁo, vocĂȘ obtĂ©m pĂąnicos em modo de depuração (cargo build) e wrap-around em modo de produção (cargo build --release).

  • A verificação de limites (“bounds checking”) nĂŁo pode ser desativada com uma flag do compilador. Ela tambĂ©m nĂŁo pode ser desativada diretamente com a palavra-chave unsafe. No entanto, unsafe permite que vocĂȘ chame funçÔes como slice::get_unchecked que nĂŁo faz verificação de limites.

Recursos Modernos

O Rust Ă© construĂ­do com toda a experiĂȘncia adquirida nas Ășltimas dĂ©cadas.

CaracterĂ­sticas da Linguagem

  • Enums e correspondĂȘncia de padrĂ”es.
  • Generics.
  • FFI sem overhead.
  • AbstraçÔes de custo zero.

Ferramentas

  • Excelentes mensagens de erro do compilador.
  • Gerenciador de dependĂȘncias integrado.
  • Suporte integrado para testes.
  • Excelente suporte ao protocolo de servidor de linguagem (LSP).

Pontos chave:

  • AbstraçÔes de custo zero, semelhantes ao C++, significa que vocĂȘ nĂŁo precisa ‘pagar’ por construçÔes de programação de alto nĂ­vel com memĂłria ou CPU. Por exemplo, escrever um loop usando for deve resultar aproximadamente no mesmo nĂ­vel de instruçÔes de baixo nĂ­vel quanto usar a construção .iter().fold().

  • Pode valer a pena mencionar que Rust enums sĂŁo ‘Tipos de Dados AlgĂ©bricos’ (‘Algebraic Data Types’), tambĂ©m conhecidos como ‘tipos de soma’, que permitem que o sistema de tipos expresse coisas como Option<T> e Result<T, E>.

  • Lembre as pessoas de lerem os erros — muitos desenvolvedores se acostumaram ignore as longas mensagens do compilador. O compilador Rust Ă© significativamente mais “verbal” do que outros compiladores. Muitas vezes, ele lhe fornecerĂĄ sugestĂ”es prĂĄticas, prontas para copiar e colar em seu cĂłdigo.

  • A biblioteca padrĂŁo do Rust (Rust standard library) Ă© pequena comparada a linguagens como Java, Python e Go. Rust nĂŁo vem com vĂĄrias coisas que vocĂȘ pode considerar padrĂŁo e essencial:

    • um gerador de nĂșmeros aleatĂłrios, mas veja rand.
    • suporte para SSL ou TLS, mas consulte rusttls.
    • suporte para JSON, mas consulte serde_json. O raciocĂ­nio por trĂĄs disso Ă© que funcionalidade na biblioteca padrĂŁo nĂŁo pode ser descartada, portanto ela tem que ser muito estĂĄvel. Para os exemplos acima, a comunidade do Rust ainda estĂĄ trabalhando para encontrar a melhor solução — e talvez nĂŁo exista uma Ășnica “melhor solução” para algumas dessas coisas. Rust vem com um gerenciador de pacotes embutido na forma de Cargo e isso torna trivial baixar e compilar crates de terceiros. Uma consequĂȘncia disso Ă© que a biblioteca padrĂŁo pode ser menor.

    Descobrir bons crates de terceiros pode ser um problema. Sites como https://lib.rs/ ajudam com isso, permitindo que vocĂȘ compare mĂ©tricas de crates para encontrar um bom e confiĂĄvel.

  • rust-analyzer Ă© uma implementação LSP bem suportada usada pelas principais IDEs e editores de texto.

Sintaxe BĂĄsica

Grande parte da sintaxe do Rust serĂĄ familiar para vocĂȘ que vem de C, C++ ou Java:

  • Blocos e escopos sĂŁo delimitados por chaves.
  • ComentĂĄrios de linha sĂŁo iniciados com //, comentĂĄrios de bloco sĂŁo delimitados por /* ... */.
  • Palavras-chave como if e while funcionam da mesma forma.
  • A atribuição de variĂĄveis Ă© feita com =, a comparação Ă© feita com ==.

Tipos Escalares

TiposLiterais
Inteiros com sinali8, i16, i32, i64, i128, isize-10, 0, 1_000, 123_i64
Inteiros sem sinalu8, u16, u32, u64, u128, usize0, 123, 10_u16
NĂșmeros de ponto flutuantef32, f643.14, -10.0e20, 2_f32
Strings&str"foo", "two\nlines"
Valores escalares Unicodechar'a', 'α', '∞'
Booleanosbooltrue, false

Os tipos tĂȘm os seguintes tamanhos:

  • iN, uN e fN tĂȘm N bits,
  • isize e usize sĂŁo do tamanho de um ponteiro,
  • char tem 32 bits,
  • bool tem 8 bits.

HĂĄ algumas sintaxes que nĂŁo sĂŁo mostradas acima:

  • Strings brutas permitem que vocĂȘ crie um valor &str com caracteres de escape desabilitados: r"\n" == "\\n". VocĂȘ pode embutir aspas duplas utilizando uma quantidade igual de # em Ambos os lados das aspas:

    fn main() {
        println!(r#"<a href="link.html">link</a>"#);
        println!("<a href=\"link.html\">link</a>");
    }
  • Strings de byte permitem que vocĂȘ crie um valor &[u8] diretamente:

    fn main() {
        println!("{:?}", b"abc");
        println!("{:?}", &[97, 98, 99]);
    }
  • Todos os sublinhados em nĂșmeros podem ser omitidos, eles sĂŁo apenas para legibilidade. Por exemplo, 1_000 pode ser escrito como 1000 (ou 10_00), e 123_i64 pode ser escrito como 123i64.

Tipos Compostos

TiposLiterais
Matrizes[T; N][20, 30, 40], [0; 3]
Tuplas(), (T,), (T1, T2), 
(), ('x',), ('x', 1.2), 


Atribuição e acesso a matrizes:

fn main() {
    let mut a: [i8; 10] = [42; 10];
    a[5] = 0;
    println!("a: {:?}", a);
}

Atribuição e acesso a tuplas:

fn main() {
    let t: (i8, bool) = (7, true);
    println!("1Âș Ă­ndice: {}", t.0);
    println!("2Âș Ă­ndice: {}", t.1);
}

Pontos chave:

Vetores:

  • O valor do tipo matriz [T; N] comporta N elementos (constante em tempo de compilação) do mesmo tipo N. Note que o tamanho de uma matriz Ă© parte do seu tipo, o que significa que [u8; 3] e [u8; 4] sĂŁo considerados dois tipos diferentes.

  • NĂłs podemos usar literais para atribuir valores para matrizes.

  • Na função main, o comando print pede a implementação de depuração (debug) com o parĂąmetro de formato formato ?: {} produz a saĂ­da padrĂŁo, {:?} produz a saĂ­da de depuração. NĂłs tambĂ©m poderĂ­amos ter usado {a} e {a:?} sem especificar o valor depois da string de formato.

  • Adicionando #, p.ex. {a:#?}, invoca um formato “pretty printing” (“impressĂŁo bonita”), que pode ser mais legĂ­vel.

Tuplas:

  • Assim como matrizes, tuplas tĂȘm tamanho fixo.

  • Tuplas agrupam valores de diferentes tipos em um tipo composto.

  • Campos de uma tupla podem ser acessados com um ponto e o Ă­ndice do valor, e.g. t.0, t.1.

  • A tupla vazia () tambĂ©m Ă© conhecida como “tipo unidade” (unit type). É tanto um tipo quanto o Ășnico valor vĂĄlido desse tipo - ou seja, o tipo e seu valor sĂŁo expressos como (). É usado para indicar, por exemplo, que uma função ou expressĂŁo nĂŁo tem valor de retorno, como veremos em um slide futuro.

    • VocĂȘ pode pensar nisso como um void, que talvez lhe seja familiar de outras linguagens de programação.

ReferĂȘncias

Como C++, o Rust tem referĂȘncias:

fn main() {
    let mut x: i32 = 10;
    let ref_x: &mut i32 = &mut x;
    *ref_x = 20;
    println!("x: {x}");
}

Algumas notas:

  • Devemos desreferenciar ref_x ao atribuĂ­-lo um valor, semelhante Ă  ponteiros em C e C++.
  • Em alguns casos, o Rust desreferenciarĂĄ automaticamente, em particular ao invocar mĂ©todos (tente ref_x.count_ones()).
  • As referĂȘncias que sĂŁo declaradas como mut podem ser vinculadas a diferentes valores ao longo de seu tempo de vida.

Pontos chave:

  • Certifique-se de observar a diferença entre let mut ref_x: &i32 e let ref_x: &mut i32. O primeiro representa uma referĂȘncia mutĂĄvel que pode ser ligada a diferentes valores, enquanto o segundo representa uma referĂȘncia a um valor mutĂĄvel.

ReferĂȘncias Soltas

Rust estaticamente proibirĂĄ referĂȘncias pendentes:

fn main() {
    let ref_x: &i32;
    {
        let x: i32 = 10;
        ref_x = &x;
    }
    println!("ref_x: {ref_x}");
}
  • Diz-se que uma referĂȘncia “pega emprestado” o valor a que se refere.
  • Rust estĂĄ rastreando os tempos de vida de todas as referĂȘncias para garantir que elas durem o suficiente.
  • Falaremos mais sobre emprĂ©stimos quando chegarmos Ă  ownership.

Slices

Uma slice (fatia) oferece uma visão de uma coleção maior:

fn main() {
    let mut a: [i32; 6] = [10, 20, 30, 40, 50, 60];
    println!("a: {a:?}");

    let s: &[i32] = &a[2..4];

    println!("s: {s:?}");
}
  • Slices pegam dados emprestados do tipo original.
  • Pergunta: O que acontece se vocĂȘ modificar a[3] imediatamente antes de imprimir s?
  • NĂłs criamos uma slice emprestando a e especificando os Ă­ndices de inĂ­cio e fim entre colchetes.

  • Se a slice começa no Ă­ndice 0, a sintaxe de range (faixa) nos permite omitir o Ă­ndice inicial, o que significa que &a[0..a.len()] e &a[..a.len()] sĂŁo idĂȘnticos.

  • O mesmo vale para o Ășltimo Ă­ndice, logo &a[2..a.len()] e &a[2..] sĂŁo idĂȘnticos.

  • Para criar facilmente uma slice de uma matriz completa, podemos utilizar&a[..].

  • s Ă© uma referĂȘncia a uma slice de i32. Observe que o tipo de s (&[i32]) nĂŁo menciona mais o tamanho da matriz. Isso nos permite realizar cĂĄlculos em slices de tamanhos diferentes.

  • As slices sempre pegam emprestado de outro objeto. Neste exemplo, a deve permanecer ‘vivo’ (em escopo) por pelo menos tanto tempo quanto nossa slice.

  • A questĂŁo sobre a modificação de a[3] pode gerar uma discussĂŁo interessante, mas a resposta Ă© que por motivos de segurança de memĂłria vocĂȘ nĂŁo pode fazer isso por meio de a neste ponto durante a execução, mas vocĂȘ pode ler os dados de a e s com segurança. Isto funciona antes da criação do slice, e novamente depois de println, quando o slice nĂŁo Ă© mais necessĂĄrio. Mais detalhes serĂŁo explicados na seção do verificador de emprĂ©stimos.

String vs str

Agora podemos entender os dois tipos de strings em Rust:

fn main() {
    let s1: &str = "Mundo";
    println!("s1: {s1}");

    let mut s2: String = String::from("OlĂĄ ");
    println!("s2: {s2}");
    s2.push_str(s1);
    println!("s2: {s2}");
    
    let s3: &str = &s2[6..];
    println!("s3: {s3}");
}

Terminologia do Rust:

  • &str Ă© uma referĂȘncia imutĂĄvel para uma slice de string.
  • String Ă© um buffer de string mutĂĄvel.
  • &str introduz uma slice de string, a qual Ă© uma referĂȘncia imutĂĄvel para os dados da string em formato UTF-8 armazenados em um bloco de memĂłria. Literais de string ("Hello") sĂŁo armazenadas no cĂłdigo binĂĄrio do programa.

  • O tipo String do Rust Ă© um invĂłlucro ao redor de uma matriz de bytes. Assim como um Vec<T>, ele Ă© owned.

  • Da mesma forma que outros tipos, String::from() cria uma string a partir de um literal; String::new() cria uma nova string vazia, na qual dados de string podem ser adicionados com os mĂ©todos push() e push_str().

  • A macro format!() Ă© uma maneira conveniente de gerar uma string owned a partir de valores dinĂąmicos. Ela aceita os mesmos formatadores que println!().

  • VocĂȘ pode emprestar slices &str de String atravĂ©s do operador & e, opcionalmente, selecionar um range (“intervalo”).

  • Para programadores C++: pense em &str como const char* de C++, mas que sempre aponta para uma string vĂĄlida na memĂłria. Em Rust, String Ă© um equivalente aproximado de std::string de C++ (principal diferença: ele sĂł pode conter bytes codificados em UTF-8 e nunca usarĂĄ uma otimização de string pequena).

FunçÔes

Uma versĂŁo em Rust da famosa pergunta de entrevistas FizzBuzz:

fn main() {
    print_fizzbuzz_to(20);
}

fn is_divisible(n: u32, divisor: u32) -> bool {
    if divisor == 0 {
        return false;
    }
    n % divisor == 0
}

fn fizzbuzz(n: u32) -> String {
    let fizz = if is_divisible(n, 3) { "fizz" } else { "" };
    let buzz = if is_divisible(n, 5) { "buzz" } else { "" };
    if fizz.is_empty() && buzz.is_empty() {
        return format!("{n}");
    }
    format!("{fizz}{buzz}")
}

fn print_fizzbuzz_to(n: u32) {
    for i in 1..=n {
        println!("{}", fizzbuzz(i));
    }
}
  • Nos referimos em main a uma função escrita abaixo. Nem declaraçÔes prĂ©vias e nem cabeçalhos sĂŁo necessĂĄrios.
  • Os parĂąmetros de declaração sĂŁo seguidos por um tipo (o inverso de algumas linguagens de programação) e, em seguida, um tipo de retorno.
  • A Ășltima expressĂŁo em um corpo de uma função (ou qualquer bloco) torna-se o valor de retorno. Simplesmente omita o ; no final da expressĂŁo.
  • Algumas funçÔes nĂŁo tĂȘm valor de retorno e retornam o ‘tipo unitĂĄrio’, (). O compilador irĂĄ inferir isso se o tipo de retorno -> () for omitido.
  • A expressĂŁo de intervalo no loop for em imprimir_fizzbuzz_para() contĂ©m =n, o que faz com que inclua o limite superior.

Rustdoc

Todos os itens da linguagem podem ser documentados com a sintaxe especial ///.

/// Determine se o primeiro argumento Ă© divisĂ­vel pelo segundo argumento.
///
/// Se o segundo argumento for zero, o resultado Ă© falso.
fn is_divisible_by(lhs: u32, rhs: u32) -> bool {
    if rhs == 0 {
        return false;  // Caso excepcional, retorne antes
    }
    lhs % rhs == 0     // A Ășltima expressĂŁo do bloco Ă© o valor de retorno
}

O conteĂșdio Ă© tratado como Markdown. Todos os crates publicados na biblioteca Rust sĂŁo documentados automaticamente em docs.rs utilizando a ferramenta rustdoc. É idiomĂĄtico documentar todos os itens pĂșblicos em uma API usando este padrĂŁo.

  • Mostre aos alunos os documentos gerados para o crate rand em docs.rs/rand.

  • Este curso nĂŁo inclui o rustdoc nos slides, apenas para economizar espaço, mas em cĂłdigo real eles devem estar presentes.

  • Os comentĂĄrios internos do documento sĂŁo discutidos posteriormente (na pĂĄgina sobre mĂłdulos) e nĂŁo precisam ser ser abordados aqui.

  • Os comentĂĄrios do Rustdoc podem conter trechos de cĂłdigo-fonte, que podem ser executados e testados por meio de cargo test. NĂłs discutiremos estes testes na seção de Testes.

MĂ©todos

Métodos são funçÔes associadas a um tipo específico. O primeiro argumento (self) de um método é uma instùncia do tipo ao qual estå associado:

struct Rectangle {
    width: u32,
    height: u32,
}

impl Rectangle {
    fn area(&self) -> u32 {
        self.width * self.height
    }

    fn inc_width(&mut self, delta: u32) {
        self.width += delta;
    }
}

fn main() {
    let mut rect = Rectangle { width: 10, height: 5 };
    println!("area antiga: {}", rect.area());
    rect.inc_width(5);
    println!("nova area: {}", rect.area());
}
  • Veremos muito mais sobre mĂ©todos no exercĂ­cio de hoje e na aula de amanhĂŁ.
  • Add a static method called Rectangle::new and call this from main:

    fn new(width: u32, height: u32) -> Rectangle {
        Rectangle { width, height }
    }
  • While technically, Rust does not have custom constructors, static methods are commonly used to initialize structs (but don’t have to). The actual constructor, Rectangle { width, height }, could be called directly. See the Rustnomicon.

  • Add a Rectangle::square(width: u32) constructor to illustrate that such static methods can take arbitrary parameters.

Sobrecarga de FunçÔes

Sobrecarga nĂŁo Ă© suportada:

  • Cada função tem uma Ășnica implementação:
    • Sempre tem um nĂșmero fixo de parĂąmetros.
    • Sempre usa um Ășnico conjunto de tipos de parĂąmetros.
  • Valores padrĂŁo nĂŁo sĂŁo suportados:
    • Todos as chamadas tĂȘm o mesmo nĂșmero de argumentos.
    • Às vezes macros sĂŁo utilizadas como alternativa.

No entanto, os parùmetros da função podem ser tipos genéricos:

fn pick_one<T>(a: T, b: T) -> T {
    if std::process::id() % 2 == 0 { a } else { b }
}

fn main() {
    println!("lance da moeda: {}", pick_one("cara", "coroa"));
    println!("prĂȘmio em dinheiro: {}", pick_one(500, 1000));
}
  • Ao usar tipos genĂ©ricos, o Into<T> da biblioteca padrĂŁo pode fornecer um tipo de polimorfismo limitado nos tipos de argumento. Veremos mais detalhes em uma seção posterior.

Dia 1: ExercĂ­cios Matinais

Nestes exercĂ­cios, vamos explorar duas partes do Rust:

  • ConversĂ”es implĂ­citas entre tipos.

  • Matrizes (Arrays) e loops (laços) for.

Algumas coisas a considerar ao resolver os exercĂ­cios:

  • Se possĂ­vel, use uma instalação local do Rust. Desta forma, vocĂȘ pode obter preenchimento automĂĄtico em seu editor. Veja a pĂĄgina sobre Utilização do Cargo para detalhes sobre instalação do Rust.

  • Alternativamente, utilize o Rust Playground.

Os trechos de cĂłdigo nĂŁo sĂŁo editĂĄveis de propĂłsito: os trechos de cĂłdigo embutidos perdem seu estado se vocĂȘ sair da pĂĄgina.

Depois de ver os exercĂ­cios, vocĂȘ pode ver as soluçÔes fornecidas.

ConversÔes Implícitas

Rust nĂŁo aplicarĂĄ automaticamente conversĂ”es implĂ­citas entre os tipos (ao contrĂĄrio de C++). VocĂȘ pode ver isso em um programa como este:

fn multiply(x: i16, y: i16) -> i16 {
    x * y
}

fn main() {
    let x: i8 = 15;
    let y: i16 = 1000;

    println!("{x} * {y} = {}", multiply(x, y));
}

Todos os tipos inteiros do Rust implementam os traits From<T> e Into<T> para nos deixar converter entre eles. O trait From<T> tem um Ășnico mĂ©todo from() e da mesma forma, o trait Into<T> tem um Ășnico mĂ©todo into(). A implementação desses traits Ă© como um tipo expressa que pode ser convertido em outro tipo.

A biblioteca padrão tem uma implementação de From<i8> for i16, o que significa que podemos converter uma variåvel x do tipo i8 para um i16 chamando i16::from(x). Ou, mais simples, com x.into(), porque a implementação From<i8> for i16 cria automaticamente uma implementação de Into<i16> for i8.

O mesmo se aplica às suas próprias implementaçÔes de From para seus próprios tipos, logo é suficiente implementar apenas From para obter uma respectiva implementação Into automaticamente.

  1. Execute o programa acima e observe o erro de compilação.

  2. Atualize o cĂłdigo acima para utilizar into() para fazer a conversĂŁo.

  3. Mude os tipos de x e y para outros tipos (como f32, bool, i128) para ver quais tipos vocĂȘ pode converter para quais outros tipos. Experimente converter tipos pequenos em tipos grandes e vice-versa. Verifique a documentação da biblioteca padrĂŁo para ver se From<T> estĂĄ implementado para os pares que vocĂȘ verificar.

Matrizes (Arrays) e Loops (Laços) for

Vimos que uma matriz pode ser declarada assim:

#![allow(unused)]
fn main() {
let array = [10, 20, 30];
}

VocĂȘ pode imprimir tal matriz solicitando sua representação de depuração com {:?}:

fn main() {
    let array = [10, 20, 30];
    println!("matriz: {array:?}");
}

Rust permite iterar em coisas como matrizes e ranges (faixas ou intervalos) usando a palavra-chave for:

fn main() {
    let array = [10, 20, 30];
    print!("Iterando sobre a matriz:");
    for n in &array {
        print!(" {n}");
    }
    println!();

    print!("Iterando sobre um range:");
    for i in 0..3 {
        print!(" {}", array[i]);
    }
    println!();
}

Use o exercício acima para escrever uma função pretty_print que imprime uma matriz e uma função transpose que irå transpor uma matriz (transformar linhas em colunas):

2584567⎀8⎄9⎊transpose==⎛⎡1⎜⎱4⎝⎣73⎀⎞6⎄⎟9⎩⎠⎡1⎱2⎣3

Limite ambas as funçÔes a operar em matrizes 3 × 3.

Copie o código abaixo para https://play.rust-lang.org/ e implemente as funçÔes:

// TODO: remova isto quando vocĂȘ terminar sua implementação .
#![allow(unused_variables, dead_code)]

fn transpose(matrix: [[i32; 3]; 3]) -> [[i32; 3]; 3] {
    unimplemented!()
}

fn pretty_print(matrix: &[[i32; 3]; 3]) {
    unimplemented!()
}

fn main() {
    let matrix = [
        [101, 102, 103], // <-- o comentĂĄrio faz com que o rustfmt adicione uma nova linha
        [201, 202, 203],
        [301, 302, 303],
    ];

    println!("matriz:");
    pretty_print(&matrix);

    let transposed = transpose(matrix);
    println!("transposta:");
    pretty_print(&transposed);
}

Pergunta BĂŽnus

VocĂȘ poderia usar slices &[i32] em vez de matrizes 3 × 3 fixas no cĂłdigo para o seu argumento e tipos de retorno? Algo como &[&[i32]] para um slice-de-slices bidimensional. Por que sim ou por que nĂŁo?

Veja o crate ndarray para uma implementação de produção.

A solução e a resposta para a seção de bÎnus estão disponíveis na Seção SoluçÔes.

O uso da referĂȘncia &matriz em for n in &matriz Ă© uma prĂ©via sutil das questĂ”es de propriedade que surgirĂŁo Ă  tarde.

Sem o &


  • O loop teria sido o que consome a matriz. Esta Ă© uma mudança introduzida na Edição de 2021.
  • Uma cĂłpia implĂ­cita da matriz teria ocorrido. Como i32 Ă© um tipo de cĂłpia (copy type), entĂŁo [i32; 3] tambĂ©m Ă© um tipo de cĂłpia.

Controle de Fluxo

Como vimos, if Ă© uma expressĂŁo em Rust. É usado para avaliar condicionalmente um de dois blocos, mas os blocos podem ter um valor que entĂŁo se torna o valor da expressĂŁo if. Outras expressĂ”es de controle de fluxo funcionam de forma semelhante em Rust.

Blocos

Um bloco em Rust contĂȘm uma sequĂȘncia de expressĂ”es. Cada bloco tem um valor e um tipo, os quais sĂŁo os da Ășltima expressĂŁo do bloco:

fn main() {
    let x = {
        let y = 10;
        println!("y: {y}");
        let z = {
            let w = {
                3 + 4
            };
            println!("w: {w}");
            y * w
        };
        println!("z: {z}");
        z - y
    };
    println!("x: {x}");
}

Se a Ășltima expressĂŁo terminar com ;, o valor resultante e o tipo serĂĄ ().

A mesma regra é usada para funçÔes: o valor do corpo da função é o valor de retorno:

fn double(x: i32) -> i32 {
    x + x
}

fn main() {
    println!("dobrado: {}", double(7));
}

Pontos Chave:

  • O objetivo deste slide Ă© mostrar que os blocos tĂȘm um tipo e um valor em Rust.
  • VocĂȘ pode mostrar como o valor do bloco muda alterando a Ășltima linha do bloco. Por exemplo, adicionar/remover um ponto e vĂ­rgula (;) ou usar um return.

ExpressÔes if

VocĂȘ usa expressĂ”es if exatamente como declaraçÔes if em outras linguagens:

fn main() {
    let mut x = 10;
    if x % 2 == 0 {
        x = x / 2;
    } else {
        x = 3 * x + 1;
    }
}

AlĂ©m disso, vocĂȘ pode usĂĄ-lo como uma expressĂŁo. A Ășltima expressĂŁo de cada bloco se torna o valor da expressĂŁo if

fn main() {
    let mut x = 10;
    x = if x % 2 == 0 {
        x / 2
    } else {
        3 * x + 1
    };
}

Como if Ă© uma expressĂŁo e deve ter um tipo especĂ­fico, ambos os blocos de ramificação devem ter o mesmo tipo. Considere mostrar o que acontece se vocĂȘ adicionar um ; depois de x / 2 no segundo exemplo.

Loops (Laços) for

O loop for estĂĄ intimamente relacionado com o loop while let. Ele chamarĂĄ automaticamente into_iter() na expressĂŁo e, em seguida, iterarĂĄ sobre ela:

fn main() {
    let v = vec![10, 20, 30];

    for x in v {
        println!("x: {x}");
    }
    
    for i in (0..10).step_by(2) {
        println!("i: {i}");
    }
}

Aqui vocĂȘ pode usar break e continue como de costume.

  • A iteração de Ă­ndice nĂŁo Ă© uma sintaxe especial no Rust apenas para esse caso.
  • (0..10) Ă© um range (intervalo) que implementa um trait Iterator.
  • step_by Ă© um mĂ©todo que retorna outro Iterator que pula outros elementos alternadamente.
  • Modifique os elementos no vetor e explique os erros de compilação. Altere o vetor v para ser mutĂĄvel e o loop for para for x in v.iter_mut().

Loops (Laços) while

A palavra-chave while funciona de maneira muito similar a outras linguagens:

fn main() {
    let mut x = 10;
    while x != 1 {
        x = if x % 2 == 0 {
            x / 2
        } else {
            3 * x + 1
        };
    }
    println!("X final: {x}");
}

break e continue

  • Se vocĂȘ quiser sair de um loop cedo, use break,
  • Se vocĂȘ quiser iniciar imediatamente a prĂłxima iteração use continue.

Ambos continue e break podem opcionalmente receber um label (rĂłtulo) como argumento que Ă© usado para sair de loops aninhados:

fn main() {
    let v = vec![10, 20, 30];
    let mut iter = v.into_iter();
    'outer: while let Some(x) = iter.next() {
        println!("x: {x}");
        let mut i = 0;
        while i < x {
            println!("x: {x}, i: {i}");
            i += 1;
            if i == 3 {
                break 'outer;
            }
        }
    }
}

Neste caso, paramos o loop externo após 3 iteraçÔes do loop interno.

ExpressÔes loop

Finalmente, hĂĄ uma palavra-chave loop que cria um loop infinito.

Aqui vocĂȘ deve usar break ou return para parar o loop:

fn main() {
    let mut x = 10;
    loop {
        x = if x % 2 == 0 {
            x / 2
        } else {
            3 * x + 1
        };
        if x == 1 {
            break;
        }
    }
    println!("X final: {x}");
}
  • Interrompa o loop com um valor (por exemplo, break 8) e imprima-o.
  • Observe que loop Ă© a Ășnica construção de loop que retorna um valor nĂŁo trivial . Isso ocorre porque Ă© garantido que ele serĂĄ executado pelo menos uma vez (diferente de loops while e for).

VariĂĄveis

Rust fornece segurança de tipo por meio de tipagem eståtica. Variåveis são imutåveis por padrão:

fn main() {
    let x: i32 = 10;
    println!("x: {x}");
    // x = 20;
    // println!("x: {x}");
}
  • Devido Ă  inferĂȘncia de tipos, o i32 Ă© opcional. Gradualmente mostraremos os tipos cada vez menos Ă  medida que o curso progride.

InferĂȘncia de Tipo

Rust verĂĄ como a variĂĄvel Ă© usada para determinar o tipo:

fn takes_u32(x: u32) {
    println!("u32: {x}");
}

fn takes_i8(y: i8) {
    println!("i8: {y}");
}

fn main() {
    let x = 10;
    let y = 20;

    takes_u32(x);
    takes_i8(y);
    // recebe_u32(y);
}

Este slide demonstra como o compilador Rust infere tipos com base em restriçÔes dadas por declaraçÔes e usos de variåveis.

É muito importante enfatizar que variĂĄveis declaradas assim nĂŁo sĂŁo de um tipo dinĂąmico “qualquer tipo” que possa armazenar quaisquer dados. O cĂłdigo de mĂĄquina gerado por tal declaração Ă© idĂȘntico Ă  declaração explĂ­cita de um tipo. O compilador faz o trabalho para nĂłs e nos ajuda a escrever um cĂłdigo mais conciso.

O cĂłdigo a seguir informa ao compilador para copiar para um determinado contĂȘiner genĂ©rico sem que o cĂłdigo especifique explicitamente o tipo contido, usando _ como placeholder:

fn main() {
    let mut v = Vec::new();
    v.push((10, false));
    v.push((20, true));
    println!("v: {v:?}");

    let vv = v.iter().collect::<std::collections::HashSet<_>>();
    println!("vv: {vv:?}");
}

collect depende de FromIterator, que HashSet implementa.

VariĂĄveis EstĂĄticas e Constantes

Variåveis eståticas e constantes são duas maneiras diferentes de criar valores com escopo global que não podem ser movidos ou realocados durante a execução do programa.

const

Constantes são avaliadas em tempo de compilação e seus valores são incorporados onde quer que sejam usados:

const DIGEST_SIZE: usize = 3;
const ZERO: Option<u8> = Some(42);

fn compute_digest(text: &str) -> [u8; DIGEST_SIZE] {
    let mut digest = [ZERO.unwrap_or(0); DIGEST_SIZE];
    for (idx, &b) in text.as_bytes().iter().enumerate() {
        digest[idx % DIGEST_SIZE] = digest[idx % DIGEST_SIZE].wrapping_add(b);
    }
    digest
}

fn main() {
    let digest = compute_digest("OlĂĄ");
    println!("Resumo: {digest:?}");
}

De acordo com o Rust RFC Book, eles sĂŁo expandidos no prĂłprio local (inline) quando utilizados.

Somente funçÔes marcadas como const podem ser chamadas em tempo de compilação para gerar valores const. As funçÔes const podem, entretanto, ser chamadas em tempo de execução.

static

Variåveis eståticas permanecerão vålidas durante toda a execução do programa e, portanto, não serão movidas:

static BANNER: &str = "Bem-vindo ao RustOS 3.14";

fn main() {
    println!("{BANNER}");
}

Conforme observado no Rust RFC Book, eles nĂŁo sĂŁo expandidos no local (inlined) quando utilizados e possuem um local de memĂłria real associado. Isso Ă© Ăștil para cĂłdigo inseguro (unsafe) e embarcado, e a variĂĄvel Ă© vĂĄlida durante toda a execução do programa. Quando um valor de escopo global nĂŁo tem uma razĂŁo para precisar de identidade de objeto, geralmente const Ă© preferido.

Como variĂĄveis estĂĄticas (static) sĂŁo acessĂ­veis de qualquer thread, elas precisam ser Sync. A mutabilidade interior Ă© possĂ­vel atravĂ©s de um Mutex, atĂŽmico ou similar. TambĂ©m Ă© possĂ­vel ter variĂĄveis estĂĄticas mutĂĄveis, mas elas exigem sincronização manual de forma que qualquer acesso a elas requer cĂłdigo “inseguro”. Veremos variĂĄveis estĂĄticas mutĂĄveis no capĂ­tulo sobre Unsafe Rust.

  • Mencione que const se comporta semanticamente de maneira similar ao constexpr de C++.
  • Por outro lado, static Ă© muito mais similar a um const ou variĂĄvel global mutĂĄvel em C++.
  • static fornece identidade de objeto: um endereço na memĂłria e estado conforme exigido por tipos com mutabilidade interior tais como Mutex<T>.
  • NĂŁo Ă© muito comum que alguĂ©m precise de uma constante avaliada em tempo de execução, mas Ă© Ăștil e mais seguro do que usar uma variĂĄvel estĂĄtica.
  • Dados de thread_local podem ser criados com a macro std::thread_local.

Tabela de propriedades:

PropriedadeStaticConstant
Possui um endereço na memóriaSimNão (inlined, i.e., expandida no local)
É válida durante toda a execução do programaSimNão
Pode ser mutĂĄvelSim (inseguro)NĂŁo
Avaliada em tempo de compilaçãoSim (inicializada em tempo de compilação)Sim
Inlined (expandida no local) onde quer que seja utilizadaNĂŁoSim

Escopos e Sobreposição

VocĂȘ pode sobrepor (shadow) variĂĄveis, tanto aquelas de escopos externos quanto variĂĄveis do mesmo escopo:

fn main() {
    let a = 10;
    println!("antes: {a}");

    {
        let a = "olĂĄ";
        println!("escopo interno: {a}");

        let a = true;
        println!("sobreposto no escopo interno: {a}");
    }

    println!("depois: {a}");
}
  • Definição: Shadowing Ă© diferente da mutação, porque apĂłs a sobreposição (shadowing), os locais de memĂłria de ambas as variĂĄveis existem ao mesmo tempo. Ambas estĂŁo disponĂ­veis com o mesmo nome, dependendo de onde vocĂȘ as usa no cĂłdigo.
  • Uma variĂĄvel sobreposta pode ter um tipo diferente.
  • A sobreposição parece obscura a princĂ­pio, mas Ă© conveniente para manter os valores apĂłs .unwrap().
  • O cĂłdigo a seguir demonstra por que o compilador nĂŁo pode simplesmente reutilizar locais de memĂłria ao sobrepor uma variĂĄvel imutĂĄvel em um escopo, mesmo que o tipo nĂŁo seja alterado.
fn main() {
    let a = 1;
    let b = &a;
    let a = a + 1;
    println!("{a} {b}");
}

Enums

A palavra-chave enum permite a criação de um tipo que possui algumas variantes diferentes:

fn generate_random_number() -> i32 {
    // Implementação baseada em https://xkcd.com/221/
    4  // Escolhido por uma rolagem de dados justa. Garantido ser aleatĂłrio.
}

#[derive(Debug)]
enum CoinFlip {
    Heads,
    Tails,
}

fn flip_coin() -> CoinFlip {
    let random_number = generate_random_number();
    if random_number % 2 == 0 {
        return CoinFlip::Heads;
    } else {
        return CoinFlip::Tails;
    }
}

fn main() {
    println!("VocĂȘ tirou: {:?}", flip_coin());
}

Pontos Chave:

  • EnumeraçÔes permitem coletar um conjunto de valores em um tipo
  • Esta pĂĄgina oferece um tipo de enum MoedaJogada com duas variantes Cara e Coroa. VocĂȘ pode observar o namespace ao usar variantes.
  • Este pode ser um bom momento para comparar Structs e Enums:
    • Em ambos, vocĂȘ pode ter uma versĂŁo simples sem campos (unit struct, ou estrutura unitĂĄria) ou uma com diferentes tipos de campo.
    • Em ambos, as funçÔes associadas sĂŁo definidas dentro de um bloco impl.
    • VocĂȘ pode atĂ© mesmo implementar as diferentes variantes de uma Enum com Structs separadas, mas elas nĂŁo seriam do mesmo tipo, como seriam se todas fossem definidas em uma Enum.

ConteĂșdos Variantes

VocĂȘ pode definir enums mais ricos onde as variantes carregam dados. VocĂȘ pode entĂŁo usar a instrução match (corresponder) para extrair os dados de cada variante:

enum WebEvent {
    PageLoad,                 // Variante sem conteĂșdo
    KeyPress(char),           // Variante tupla
    Click { x: i64, y: i64 }, // Variante completa
}

#[rustfmt::skip]
fn inspect(event: WebEvent) {
    match event {
        WebEvent::PageLoad       => println!("pĂĄgina carregada"),
        WebEvent::KeyPress(c)    => println!("pressionou '{c}'"),
        WebEvent::Click { x, y } => println!("clicou em x={x}, y={y}"),
    }
}

fn main() {
    let load = WebEvent::PageLoad;
    let press = WebEvent::KeyPress('x');
    let click = WebEvent::Click { x: 20, y: 80 };

    inspect(load);
    inspect(press);
    inspect(click);
}
  • Os valores nas variantes de uma enum sĂł podem ser acessados apĂłs uma correspondĂȘncia de padrĂŁo. O padrĂŁo vincula referĂȘncias aos campos no “braço” do match apĂłs =>.
    • A expressĂŁo Ă© comparada com os padrĂ”es de cima a baixo. NĂŁo existe fall-through como em C ou C++.
    • A expressĂŁo match possui um valor. O valor Ă© o da Ășltima expressĂŁo executada em um “braço” do match.
    • Começando do topo, nĂłs procuramos qual padrĂŁo corresponde ao valor, e entĂŁo executamos o cĂłdigo apĂłs a flecha. Quando uma correspondĂȘncia Ă© encontrada, nĂłs paramos.
  • Demonstre o que acontece quando a busca nĂŁo abrange todas as possibilidades. Mencione a vantagem que o compilador do Rust oferece confirmando quando todos os casos foram tratados.
  • match inspeciona um campo discriminant escondido na enum.
  • É possĂ­vel recuperar o discriminante chamando std::mem::discriminant()
    • Isso Ă© Ăștil, por exemplo, ao implementar PartialEq para structs nas quais comparar valores de campos nĂŁo afeta a igualdade.
  • WebEvent::Click { ... } nĂŁo Ă© exatamente o mesmo que WebEvent::Click(Click) com uma struct Click { ... } top-level. A versĂŁo no prĂłprio local (inline) nĂŁo permite implementar traits, por exemplo.

Tamanhos de Enum

Enums, em Rust, são agrupados de maneira compacta, levando em consideração restriçÔes devido ao alinhamento:

use std::any::type_name;
use std::mem::{align_of, size_of};

fn dbg_size<T>() {
    println!("{}: tamanho {} bytes, alinhamento: {} bytes",
        type_name::<T>(), size_of::<T>(), align_of::<T>());
}

enum Foo {
    A,
    B,
}

fn main() {
    dbg_size::<Foo>();
}

Pontos Chave:

  • Internamente Rust utiliza um campo (discriminante) para saber qual a variante da enum.

  • É possĂ­vel controlar a discriminante se necessĂĄrio (e.g., para compatibilidade com C):

    #[repr(u32)]
    enum Bar {
        A,  // 0
        B = 10000,
        C,  // 10001
    }
    
    fn main() {
        println!("A: {}", Bar::A as u32);
        println!("B: {}", Bar::B as u32);
        println!("C: {}", Bar::C as u32);
    }

    Sem repr, o tipo da discriminante usa 2 bytes, porque 10001 cabe em 2 bytes.

  • Tente outros tipos como

    • dbg_size!(bool): tamanho 1 bytes, alinhamento: 1 bytes,
    • dbg_size!(Option<bool>): tamanho 1 bytes, alinhamento: 1 bytes (otimização de nicho, seja abaixo),
    • dbg_size!(&i32): tamanho 8 bytes, alinhamento: 8 bytes (em uma mĂĄquina de 64-bits),
    • dbg_size!(Option<&i32>): tamanho 8 bytes, alinhamento: 8 bytes (otimização de ponteiro nulo, veja abaixo).
  • Otimização de nicho: Rust vai mesclar padrĂ”es de bits nĂŁo utilizados na discriminante da enum.

  • Otimização de ponteiro nulo: para alguns tipos, o Rust garante que size_of::<T>() se iguala size_of::<Option<T>>().

    CĂłdigo de exemplo caso queira mostrar como a representação em bits pode ser na prĂĄtica. É importante apontar que o compilador nĂŁo oferece nenhuma garantia a respeito dessa representação, portanto isso Ă© completamente inseguro.

    use std::mem::transmute;
    
    macro_rules! dbg_bits {
        ($e:expr, $bit_type:ty) => {
            println!("- {}: {:#x}", stringify!($e), transmute::<_, $bit_type>($e));
        };
    }
    
    fn main() {
        // TOTALLY UNSAFE. Rust provides no guarantees about the bitwise
        // representation of types.
        unsafe {
            println!("Representação em bits de booleano");
            dbg_bits!(false, u8);
            dbg_bits!(true, u8);
    
            println!("Representação em bits de Option<bool>");
            dbg_bits!(None::<bool>, u8);
            dbg_bits!(Some(false), u8);
            dbg_bits!(Some(true), u8);
    
            println!("Representação em bits de Option<Option<bool>>");
            dbg_bits!(Some(Some(false)), u8);
            dbg_bits!(Some(Some(true)), u8);
            dbg_bits!(Some(None::<bool>), u8);
            dbg_bits!(None::<Option<bool>>, u8);
    
            println!("Representação em bits de Option<&i32>");
            dbg_bits!(None::<&i32>, usize);
            dbg_bits!(Some(&0i32), usize);
        }
    }

    Exemplo mais complexo caso queira demonstrar o que acontece ao encadear mais de 256 Options de uma vez.

    #![recursion_limit = "1000"]
    
    use std::mem::transmute;
    
    macro_rules! dbg_bits {
        ($e:expr, $bit_type:ty) => {
            println!("- {}: {:#x}", stringify!($e), transmute::<_, $bit_type>($e));
        };
    }
    
    // Macro to wrap a value in 2^n Some() where n is the number of "@" signs.
    // Increasing the recursion limit is required to evaluate this macro.
    macro_rules! many_options {
        ($value:expr) => { Some($value) };
        ($value:expr, @) => {
            Some(Some($value))
        };
        ($value:expr, @ $($more:tt)+) => {
            many_options!(many_options!($value, $($more)+), $($more)+)
        };
    }
    
    fn main() {
        // TOTALLY UNSAFE. Rust provides no guarantees about the bitwise
        // representation of types.
        unsafe {
            assert_eq!(many_options!(false), Some(false));
            assert_eq!(many_options!(false, @), Some(Some(false)));
            assert_eq!(many_options!(false, @@), Some(Some(Some(Some(false)))));
    
            println!("Representação em bits de uma sequĂȘncia de 128 Option's.");
            dbg_bits!(many_options!(false, @@@@@@@), u8);
            dbg_bits!(many_options!(true, @@@@@@@), u8);
    
            println!("Representação em bits de uma sequĂȘncia de 256 Option's.");
            dbg_bits!(many_options!(false, @@@@@@@@), u16);
            dbg_bits!(many_options!(true, @@@@@@@@), u16);
    
            println!("Representação em bits de uma sequĂȘncia de 257 Option's.");
            dbg_bits!(many_options!(Some(false), @@@@@@@@), u16);
            dbg_bits!(many_options!(Some(true), @@@@@@@@), u16);
            dbg_bits!(many_options!(None::<bool>, @@@@@@@@), u16);
        }
    }

Novel Control Flow

Rust has a few control flow constructs which differ from other languages. They are used for pattern matching:

  • ExpressĂ”es if let
  • while let expressions
  • ExpressĂ”es match (CorrespondĂȘncia)

ExpressÔes if let

A expressĂŁo if let lhe permite que vocĂȘ execute um cĂłdigo diferente, dependendo se um valor corresponde a um padrĂŁo:

fn main() {
    let arg = std::env::args().next();
    if let Some(value) = arg {
        println!("Nome do programa: {value}");
    } else {
        println!("Falta o nome?");
    }
}

Consulte correspondĂȘncia de padrĂ”es (pattern matching) para obter mais detalhes sobre padrĂ”es em Rust.

  • Ao contrĂĄrio de match, if let nĂŁo precisa cobrir todas as ramificaçÔes. Isso pode tornĂĄ-lo mais conciso do que match.

  • Um uso comum Ă© lidar com valores Some ao trabalhar com Option.

  • Ao contrĂĄrio de match, if let nĂŁo suporta clĂĄusulas de guarda para correspondĂȘncia de padrĂ”es.

  • Desde 1.65, uma construção let-else semelhante permite fazer uma atribuição de desestruturação, ou se falhar, ter um bloco de ramificação sem retorno (panic/return/break/continue):

    fn main() {
        println!("{:?}", second_word_to_upper("foo bar"));
    }
     
    fn second_word_to_upper(s: &str) -> Option<String> {
        let mut it = s.split(' ');
        let (Some(_), Some(item)) = (it.next(), it.next()) else {
            return None;
        };
        Some(item.to_uppercase())
    }
    

Loops (Laços) while let

Similar a if let, hĂĄ uma variante while let que testa repetidamente se um valor corresponde a um padrĂŁo:

fn main() {
    let v = vec![10, 20, 30];
    let mut iter = v.into_iter();

    while let Some(x) = iter.next() {
        println!("x: {x}");
    }
}

Aqui o iterador retornado por v.into_iter() retornarå uma Option<i32> em cada chamada para next(). Ele retorna Some(x) até que seja concluído e, em seguida, retorna None. O while let nos permite continuar iterando por todos os itens.

Consulte correspondĂȘncia de padrĂ”es (pattern matching) para obter mais detalhes sobre padrĂ”es em Rust.

  • Ressalte que o loop while let continuarĂĄ executando enquanto o valor corresponder ao padrĂŁo.
  • VocĂȘ pode reescrever o loop while let como um loop infinito com uma instrução if que Ă© interrompido quando nĂŁo houver mais nenhum valor para desempacotar (unwrap) para iter.next(). O while let fornece um atalho para o cenĂĄrio acima.

ExpressĂ”es match (CorrespondĂȘncia)

A palavra-chave match é usada para corresponder um valor a um ou mais padrÔes. Nesse sentido, funciona como uma série de expressÔes if let:

fn main() {
    match std::env::args().next().as_deref() {
        Some("gato") => println!("Vai fazer coisas de gato"),
        Some("ls")  => println!("Vou ls alguns arquivos"),
        Some("mv")  => println!("Vamos mover alguns arquivos"),
        Some("rm")  => println!("Uh, perigoso!"),
        None        => println!("Hmm, nenhum nome de programa?"),
        _           => println!("Nome de programa desconhecido!"),
    }
}

Assim como if let, cada braço de correspondĂȘncia deve ter o mesmo tipo. O tipo Ă© a Ășltima expressĂŁo do bloco, se houver. No exemplo acima, o tipo Ă© ().

Consulte correspondĂȘncia de padrĂ”es (pattern matching) para obter mais detalhes sobre padrĂ”es em Rust.

  • Salve o resultado de uma expressĂŁo de correspondĂȘncia match em uma variĂĄvel e imprima-a.
  • Remova .as_deref() e explique o erro gerado.
    • std::env::Args().next() retorna um Option<&String>, porĂ©m match nĂŁo funciona com o tipo String.
    • as_deref() transforma um Option<T> em Option<&T::Target>. Em nosso caso, isso transforma um Option<String> em Option<&str>.
    • Agora podemos usar a correspondĂȘncia de padrĂ”es em um &str dentro de Option.

CorrespondĂȘncia de PadrĂ”es

A palavra-chave match permite que vocĂȘ corresponda um valor a um ou mais padrĂ”es (patterns). As comparaçÔes sĂŁo feitas de cima para baixo e a primeira correspondĂȘncia encontrada Ă© selecionada.

Os padrÔes podem ser valores simples, similarmente a switch em C e C++:

fn main() {
    let input = 'x';

    match input {
        'q'                   => println!("Encerrando"),
        'a' | 's' | 'w' | 'd' => println!("Movendo por ai"),
        '0'..='9'             => println!("Entrada de nĂșmero"),
        _                     => println!("Alguma outra coisa"),
    }
}

O padrĂŁo _ Ă© um padrĂŁo curinga que corresponde a qualquer valor.

Pontos Chave:

  • VocĂȘ pode apontar como alguns caracteres especĂ­ficos podem ser usados em um padrĂŁo
    • | como um ou
    • .. pode expandir o quanto for necessĂĄrio
    • 1..=5 representa um intervalo inclusivo
    • _ Ă© um curinga
  • Pode ser Ăștil mostrar como funciona a vinculação, por exemplo, substituindo um caractere curinga por uma variĂĄvel ou removendo as aspas ao redor de q.
  • VocĂȘ pode demonstrar correspondĂȘncia em uma referĂȘncia.
  • Este pode ser um bom momento para trazer Ă  tona o conceito de padrĂ”es irrefutĂĄveis, jĂĄ que o termo pode aparecer em mensagens de erro.

Desestruturando Enums

Os padrĂ”es tambĂ©m podem ser usados para vincular variĂĄveis a partes de seus valores. É assim que vocĂȘ inspeciona a estrutura de seus tipos. Vamos começar com um tipo enum simples:

enum Result {
    Ok(i32),
    Err(String),
}

fn divide_in_two(n: i32) -> Result {
    if n % 2 == 0 {
        Result::Ok(n / 2)
    } else {
        Result::Err(format!("nĂŁo Ă© possĂ­vel dividir {n} em duas partes iguais"))
    }
}

fn main() {
    let n = 100;
    match divide_in_two(n) {
        Result::Ok(half) => println!("{n} divido em dois Ă© {half}"),
        Result::Err(msg) => println!("desculpe, aconteceu um erro: {msg}"),
    }
}

Aqui usamos a verificação de correspondĂȘncia para desestruturar o valor contido em Result. Na primeira verificação de correspondĂȘncia, half estĂĄ vinculado ao valor dentro da variante Ok. Na segunda, msg estĂĄ vinculado Ă  mensagem de erro.

Pontos chave:

  • A expressĂŁo if/else estĂĄ retornando um enum que Ă© posteriormente descompactado com um match.
  • VocĂȘ pode tentar adicionar uma terceira variante Ă  definição de Enum e exibir os erros ao executar o cĂłdigo. Aponte os lugares onde seu cĂłdigo agora Ă© “nĂŁo exaustivo” e como o compilador tenta lhe dar dicas.

Desestruturando Structs

VocĂȘ tambĂ©m pode desestruturar structs:

struct Foo {
    x: (u32, u32),
    y: u32,
}

#[rustfmt::skip]
fn main() {
    let foo = Foo { x: (1, 2), y: 3 };
    match foo {
        Foo { x: (1, b), y } => println!("x.0 = 1, b = {b}, y = {y}"),
        Foo { y: 2, x: i }   => println!("y = 2, x = {i:?}"),
        Foo { y, .. }        => println!("y = {y}, outros campos foram ignorados"),
    }
}
  • Modifique os valores em foo para corresponder com os outros padrĂ”es.
  • Adicione um novo campo a Foo e faça mudanças nos padrĂ”es conforme necessĂĄrio.
  • A diferença entre uma captura (capture) e uma expressĂŁo constante pode ser difĂ­cil de perceber. Tente modificar o 2 no segundo braço para uma variĂĄvel, e veja que, de forma sĂștil, nĂŁo funciona. Mude para const e veja funcionando novamente.

Desestruturando Matrizes

VocĂȘ pode desestruturar vetores, tuplas e slices combinando seus elementos:

#[rustfmt::skip]
fn main() {
    let triple = [0, -2, 3];
    println!("Fale-me sobre {triple:?}");
    match triple {
        [0, y, z] => println!("Primeiro Ă© 0, y = {y} e z = {z}"),
        [1, ..]   => println!("Primeiro Ă© 1 e o resto foi ignorado"),
        _         => println!("Todos os elementos foram ignorados"),
    }
}
  • Desestruturar slices de tamanho desconhecido Ă© possĂ­vel utilizando padrĂ”es de tamanho fixo.

    fn main() {
        inspect(&[0, -2, 3]);
        inspect(&[0, -2, 3, 4]);
    }
    
    #[rustfmt::skip]
    fn inspect(slice: &[i32]) {
        println!("Fale-me sobre {slice:?}");
        match slice {
            &[0, y, z] => println!("Primeiro Ă© 0, y = {y} e z = {z}"),
            &[1, ..]   => println!("Primeiro Ă© 1 e o resto foi ignorado"),
            _          => println!("Todos os elementos foram ignorados"),
        }
    }
  • Crie um novo padrĂŁo usando _ para representar um elemento.

  • Adicione mais valores ao vetor.

  • Aponte que .. vai expandir para levar em conta um nĂșmero diferente de elementos.

  • Mostre correspondĂȘncia com a cauda usando os padrĂ”es [.., b] and [a@..,b]

Guardas de CorrespondĂȘncia (Match Guards)

Ao verificar uma correspondĂȘncia, vocĂȘ pode adicionar uma guarda (guard) para um padrĂŁo. É uma expressĂŁo Booleana arbitrĂĄria que serĂĄ executada se o padrĂŁo corresponder:

#[rustfmt::skip]
fn main() {
    let pair = (2, -2);
    println!("Fale-me sobre {pair:?}");
    match pair {
        (x, y) if x == y     => println!("Estes sĂŁo gĂȘmeos"),
        (x, y) if x + y == 0 => println!("Antimatter, kaboom!"),
        (x, _) if x % 2 == 1 => println!("O primeiro Ă© Ă­mpar"),
        _                    => println!("Sem correlação..."),
    }
}

Pontos Chave:

  • Guardas de correspondĂȘncia, como um recurso de sintaxe separado, sĂŁo importantes e necessĂĄrias quando se quer expressar ideias mais complexas do que somente o padrĂŁo permitiria.
  • Eles nĂŁo sĂŁo iguais Ă  expressĂŁo if separada dentro do bloco de correspondĂȘncia. Uma expressĂŁo if dentro do bloco de ramificação (depois de =>) acontece depois que a correspondĂȘncia Ă© selecionada. A falha na condição if dentro desse bloco nĂŁo resultarĂĄ em outras verificaçÔes de correspondĂȘncia da expressĂŁo match original serem consideradas.
  • VocĂȘ pode usar as variĂĄveis definidas no padrĂŁo em sua expressĂŁo if.
  • A condição definida na guarda se aplica a todas as expressĂ”es em um padrĂŁo com um |.

Dia 1: ExercĂ­cios da Tarde

NĂłs iremos ver duas coisas:

  • The Luhn algorithm,

  • An exercise on pattern matching.

Depois de ver os exercĂ­cios, vocĂȘ pode ver as soluçÔes fornecidas.

Algoritmo de Luhn

O algoritmo de Luhn Ă© usado para validar nĂșmeros de cartĂŁo de crĂ©dito. O algoritmo recebe uma string como entrada e faz o seguinte para validar o nĂșmero do cartĂŁo de crĂ©dito:

  • Ignore todos os espaços. Rejeite nĂșmero com menos de dois dĂ­gitos.

  • Moving from right to left, double every second digit: for the number 1234, we double 3 and 1. For the number 98765, we double 6 and 8.

  • Depois de dobrar um dĂ­gito, some os dĂ­gitos. Portanto, dobrando 7 torna-se 14, que torna-se 5.

  • Some todos os dĂ­gitos, dobrados ou nĂŁo.

  • O nĂșmero do cartĂŁo de crĂ©dito Ă© vĂĄlido se a soma terminar em 0.

Copy the code below to https://play.rust-lang.org/ and implement the function.

Try to solve the problem the “simple” way first, using for loops and integers. Then, revisit the solution and try to implement it with iterators.

// TODO: remova isto quando vocĂȘ terminar sua implementação .
#![allow(unused_variables, dead_code)]

pub fn luhn(cc_number: &str) -> bool {
    unimplemented!()
}

#[test]
fn test_non_digit_cc_number() {
    assert!(!luhn("foo"));
}

#[test]
fn test_empty_cc_number() {
    assert!(!luhn(""));
    assert!(!luhn(" "));
    assert!(!luhn("  "));
    assert!(!luhn("    "));
}

#[test]
fn test_single_digit_cc_number() {
    assert!(!luhn("0"));
}

#[test]
fn test_two_digit_cc_number() {
    assert!(luhn(" 0 0 "));
}

#[test]
fn test_valid_cc_number() {
    assert!(luhn("4263 9826 4026 9299"));
    assert!(luhn("4539 3195 0343 6467"));
    assert!(luhn("7992 7398 713"));
}

#[test]
fn test_invalid_cc_number() {
    assert!(!luhn("4223 9826 4026 9299"));
    assert!(!luhn("4539 3195 0343 6476"));
    assert!(!luhn("8273 1232 7352 0569"));
}

#[allow(dead_code)]
fn main() {}

Bem-vindos ao Dia 2

Agora que vimos uma boa quantidade de Rust, continuaremos com:

  • Gerenciamento de memĂłria: pilha versus heap, gerenciamento de memĂłria manual, gerenciamento de memĂłria baseado em escopo e garbage collection (coleta de lixo).

  • Ownership (posse): semĂąntica de move, cĂłpia e clonagem, borrow (emprĂ©stimo) e lifetime (tempo de vida).

  • Structs and methods.

  • A Biblioteca PadrĂŁo: String, Option e Result, Vec, HashMap, Rc e Arc.

  • MĂłdulos: visibilidade, caminhos (paths), e hierarquia do sistema de arquivos.

Gerenciamento de MemĂłria

Tradicionalmente, as linguagens se dividem em duas grandes categorias:

  • Controle total atravĂ©s do gerenciamento manual de memĂłria: C, C++, Pascal, 

  • Segurança total atravĂ©s do gerenciamento automĂĄtico de memĂłria em tempo de execução: Java, Python, Go, Haskell, 


Rust oferece uma nova combinação:

Controle total e segurança por imposição do correto gerenciamento de memória em tempo de compilação.

Ele faz isso com um conceito de ownership (posse) explĂ­cito.

Primeiro, vamos rever como funciona o gerenciamento de memĂłria.

A Pilha (Stack) vs O Heap

  • Pilha: Área contĂ­nua de memĂłria para variĂĄveis locais.

    • Os valores tĂȘm tamanhos fixos conhecidos em tempo de compilação.
    • Extremamente rĂĄpida: basta mover um ponteiro de pilha.
    • FĂĄcil de gerenciar: segue chamadas de função.
    • Ótima localidade de memĂłria.
  • Heap: Armazenamento de valores fora das chamadas de função.

    • Valores possuem tamanhos dinĂąmicos determinados em tempo de execução.
    • Ligeiramente mais devagar que a pilha: Ă© necessĂĄrio um pouco de gerenciamento.
    • Sem garantias de localidade de memĂłria.

Exemplo de Pilha e Heap

A criação de uma String coloca metadados de tamanho fixo na pilha e dados dinamicamente dimensionados - a string propriamente dita - no heap:

fn main() {
    let s1 = String::from("OlĂĄ");
}
StackHeaps1ptrHellolen5capacity5
  • Mencione que uma String Ă© suportada por um Vec, portanto ela tem um tamanho e capacidade e pode crescer se for mutĂĄvel por meio de realocação no heap.

  • Se os alunos perguntarem sobre isso, vocĂȘ pode mencionar que a memĂłria subjacente Ă© alocada no heap usando o System Allocator e os alocadores personalizados podem ser implementados usando a API Allocator.

  • Podemos inspecionar o layout da memĂłria com cĂłdigo inseguro (unsafe). No entanto, vocĂȘ deve apontar que isso Ă© legitimamente inseguro!

    fn main() {
        let mut s1 = String::from("OlĂĄ");
        s1.push(' ');
        s1.push_str("mundo");
        // DON'T DO THIS AT HOME! For educational purposes only.
        // String provides no guarantees about its layout, so this could lead to
        // undefined behavior.
        unsafe {
            let (ptr, capacity, len): (usize, usize, usize) = std::mem::transmute(s1);
            println!("Ponteiro = {ptr:#x}, tamanho = {len}, capacidade = {capacity}");
        }
    }

Gerenciamento Manual de MemĂłria

VocĂȘ mesmo aloca e desaloca memĂłria no heap.

Se isto não for feito com cuidado, travamentos, bugs, vulnerabilidades de segurança e vazamentos de memória podem ocorrer.

Exemplo em C

VocĂȘ deve chamar free em cada ponteiro que alocar com malloc:

void foo(size_t n) {
    int* int_array = malloc(n * sizeof(int));
    //
    // ... vĂĄrias linhas de cĂłdigo
    //
    free(int_array);
}

Memória é vazada se a função retornar mais cedo entre malloc e free: o ponteiro é perdido e não podemos liberar a memória. Pior ainda, liberando o ponteiro duas vezes, ou acessando um ponteiro jå liberado pode levar a vulnerabilidades de segurança.

Gerenciamento de MemĂłria Baseado em Escopo

Construtores e destrutores permitem que o tempo de vida de um objeto seja rastreado.

Ao envolver um ponteiro em um objeto, vocĂȘ pode liberar memĂłria quando o objeto Ă© destruĂ­do. O compilador garante que isso aconteça, mesmo que uma exceção seja lançada.

Isso geralmente é chamado de aquisição de recursos é inicialização (Resource Acquisition Is Initialization, RAII) e fornece ponteiros inteligentes (smart pointers).

Exemplo em C++

void say_hello(std::unique_ptr<Person> person) {
  std::cout << "OlĂĄ " << person->name << std::endl;
}
  • O objeto std::unique_ptr Ă© alocado na pilha e aponta para memĂłria alocada no heap.
  • No final de diga_ola, o destrutor std::unique_ptr serĂĄ executado.
  • O destrutor libera o objeto Pessoa para o qual ele aponta.

Construtores especiais de movimento (move) são usados ao passar o “ownership” para uma função:

std::unique_ptr<Person> person = find_person("Carla");
say_hello(std::move(person));

Gerenciamento AutomĂĄtico de MemĂłria

Uma alternativa ao gerenciamento de memĂłria manual e baseado em escopo Ă© o gerenciamento automĂĄtico de memĂłria:

  • O programador nunca aloca ou desaloca memĂłria explicitamente.
  • Um “coletor de lixo” (garbage collector) encontra memĂłria nĂŁo utilizada e a desaloca para o programador.

Exemplo em Java

O objeto pessoa nĂŁo Ă© desalocado depois que digaOla retorna:

void sayHello(Person person) {
  System.out.println("OlĂĄ " + person.getName());
}

Gerenciamento de MemĂłria no Rust

O gerenciamento de memória no Rust é uma combinação:

  • Seguro e correto como Java, mas sem um coletor de lixo.
  • Dependendo de qual abstração (ou combinação de abstraçÔes) vocĂȘ escolher, pode ser um simples ponteiro Ășnico, referĂȘncia contada ou referĂȘncia atomicamente contada.
  • Baseado em escopo como C++, mas o compilador impĂ”e adesĂŁo total.
  • Um usuĂĄrio do Rust pode escolher a abstração certa para a situação, algumas atĂ© sem custo em tempo de execução como C.

O Rust consegue isso modelando o ownership (posse) explicitamente.

  • Neste ponto, se perguntado como, vocĂȘ pode mencionar que em Rust isso geralmente Ă© tratado por wrappers (invĂłlucros) RAII tais como Box, Vec, Rc ou Arc. Eles encapsulam a propriedade (ownership) e a alocação de memĂłria por vĂĄrios meios e previnem os erros possĂ­veis em C.

  • Aqui vocĂȘ pode ser perguntado sobre destrutores, o trait Drop Ă© o equivalente em Rust.

Comparação

Aqui estå uma comparação aproximada das técnicas de gerenciamento de memória.

Vantagens de Diferentes TĂ©cnicas de Gerenciamento de MemĂłria

  • Manual como C:
    • Nenhuma sobrecarga em tempo de execução.
  • AutomĂĄtico como Java:
    • Totalmente automatizado.
    • Seguro e correto.
  • Baseado em escopo como C++:
    • Parcialmente automĂĄtico.
    • Nenhuma sobrecarga em tempo de execução.
  • Baseado em escopo imposto pelo compilador como Rust:
    • Imposto pelo compilador.
    • Nenhuma sobrecarga em tempo de execução.
    • Seguro e correto.

Desvantagens de Diferentes TĂ©cnicas de Gerenciamento de MemĂłria

  • Manual como C:
    • Uso apĂłs a liberação (use-after-free).
    • LiberaçÔes duplas (double-frees).
    • Vazamentos de memĂłria.
  • AutomĂĄtico como Java:
    • Pausas para coleta de lixo.
    • Atrasos na execução de destrutores.
  • Baseado em escopo como C++:
    • Complexo, o programador deve optar em utilizĂĄ-las.
    • ReferĂȘncias circulares podem causar vazamentos de memĂłria
    • Potencial impacto negativo em desempenho em tempo de execução
  • Imposto pelo compilador e baseado em escopo como Rust:
    • Alguma complexidade inicial.
    • Pode rejeitar programas vĂĄlidos.

Ownership

Todas as associaçÔes de variĂĄveis tĂȘm um escopo onde sĂŁo vĂĄlidas e Ă© um erro usar uma variĂĄvel fora de seu escopo:

struct Point(i32, i32);

fn main() {
    {
        let p = Point(3, 4);
        println!("x: {}", p.0);
    }
    println!("y: {}", p.1);
}
  • No final do escopo, a variĂĄvel Ă© eliminada (“dropada”) e os dados sĂŁo liberados.
  • Um destrutor pode ser executado aqui para liberar recursos.
  • Dizemos que a variĂĄvel possui (owns) o valor.

SemĂąntica do Move (mover)

Uma atribuição transferirå o ownership entre variåveis:

fn main() {
    let s1: String = String::from("OlĂĄ!");
    let s2: String = s1;
    println!("s2: {s2}");
    // println!("s1: {s1}");
}
  • A atribuição de s1 a s2 transfere o ownership.
  • Quando s1 sai do escopo, nada acontece: ele nĂŁo tem ownership.
  • Quando s2 sai do escopo, os dados da string sĂŁo liberados.
  • HĂĄ sempre exatamente uma associação de variĂĄvel que possui (“owns”) um valor.
  • Mencione que isso Ă© o oposto dos defaults (padrĂ”es) em C++, que copia por valor, a menos que vocĂȘ use std::move (e seu construtor esteja definido!).

  • Apenas o ownership Ă© movido. A geração de cĂłdigo de mĂĄquina para manipular os dados Ă© uma questĂŁo de otimização, e essas cĂłpias sĂŁo agressivamente otimizadas.

  • Valores simples (tais como inteiros) podem ser marcados como Copy (cĂłpia) (veja slides mais adiante).

  • No Rust, clones sĂŁo explĂ­citos (utilizando-se clone).

Strings Movidas em Rust

fn main() {
    let s1: String = String::from("Rust");
    let s2: String = s1;
}
  • Os dados no heap de s1 sĂŁo reutilizados para s2.
  • Quando s1 sai do escopo, nada acontece (foi movido dele).

Antes de mover para s2:

StackHeaps1ptrRustlen4capacity4

Depois de mover para s2:

PilhaHeaps1ponteiroRusttamanho4capacidade4s2ponteirotamanho4capacidade4(inacessĂ­vel)

Trabalho Extra em C++ Moderno

O C++ moderno resolve isso de maneira diferente:

std::string s1 = "Cpp";
std::string s2 = s1;  // Duplica os dados em s1.
  • Os dados de s1 no heap sĂŁo duplicados e s2 obtĂ©m sua prĂłpria cĂłpia independente.
  • Quando s1 e s2 saem de escopo, cada um libera sua prĂłpria memĂłria.

Antes da atribuição por cópia:

StackHeaps1ptrCpplen3capacity3

Após atribuição por cópia:

StackHeaps1ptrCpplen3capacity3s2ptrCpplen3capacity3

Move em Chamadas de Função

Quando vocĂȘ passa um valor para uma função, o valor Ă© atribuĂ­do ao parĂąmetro da função. Isso transfere a ownership:

fn say_hello(name: String) {
    println!("OlĂĄ {name}")
}

fn main() {
    let name = String::from("Alice");
    say_hello(name);
    // say_hello(name);
}
  • Com a primeira chamada para diga_ola, main desiste da ownership de nome. Depois disso, nome nĂŁo pode mais ser usado dentro de main.
  • A memĂłria do heap alocada para name serĂĄ liberada no final da função say_hello.
  • main pode manter a ownership se passar nome como uma referĂȘncia (&name) e se say_hello aceitar uma referĂȘncia como um parĂąmetro.
  • Alternativamente, main pode passar um clone de nome na primeira chamada (name.clone()).
  • Rust torna mais difĂ­cil a criação de cĂłpias inadvertidamente do que o C++, tornando padrĂŁo a semĂąntica de movimento e forçando os programadores a tornar os clones explĂ­citos.

Copia e Clonagem

Embora a semĂąntica de movimento seja o padrĂŁo, certos tipos sĂŁo copiados por padrĂŁo:

fn main() {
    let x = 42;
    let y = x;
    println!("x: {x}");
    println!("y: {y}");
}

Esses tipos implementam o trait Copy.

VocĂȘ pode habilitar seus prĂłprios tipos para usar a semĂąntica de cĂłpia:

#[derive(Copy, Clone, Debug)]
struct Point(i32, i32);

fn main() {
    let p1 = Point(3, 4);
    let p2 = p1;
    println!("p1: {p1:?}");
    println!("p2: {p2:?}");
}
  • ApĂłs a atribuição, tanto p1 quanto p2 possuem seus prĂłprios dados.
  • TambĂ©m podemos usar p1.clone() para copiar os dados explicitamente.

Copia e clonagem nĂŁo sĂŁo a mesma coisa:

  • CĂłpia refere-se a cĂłpias bit a bit de regiĂ”es de memĂłria e nĂŁo funciona em objetos arbitrĂĄrios.
  • CĂłpia nĂŁo permite lĂłgica personalizada (ao contrĂĄrio dos construtores de cĂłpia em C++).
  • Clonagem Ă© uma operação mais geral e tambĂ©m permite um comportamento personalizado atravĂ©s da implementação do trait Clone.
  • CĂłpia nĂŁo funciona em tipos que implementam o trait Drop.

No exemplo acima, tente o seguinte:

  • Adicione um campo String ao struct Point. Ele nĂŁo irĂĄ compilar porque String nĂŁo Ă© um tipo Copy.
  • Remova Copy do atributo derive. O erro do compilador agora estĂĄ no println! para p1.
  • Mostre que ele funciona se ao invĂ©s disso vocĂȘ clonar p1.

Se os alunos perguntarem sobre derive, basta dizer que isto é uma forma de gerar código em Rust em tempo de compilação. Nesse caso, as implementaçÔes padrão dos traits Copy e Clone são geradas.

Empréstimo (Borrowing)

Em vez de transferir a ownership ao chamar uma função, vocĂȘ pode permitir que uma função empreste o valor:

#[derive(Debug)]
struct Point(i32, i32);

fn add(p1: &Point, p2: &Point) -> Point {
    Point(p1.0 + p2.0, p1.1 + p2.1)
}

fn main() {
    let p1 = Point(3, 4);
    let p2 = Point(10, 20);
    let p3 = add(&p1, &p2);
    println!("{p1:?} + {p2:?} = {p3:?}");
}
  • A função add pega emprestado (borrows) dois pontos e retorna um novo ponto.
  • O chamador mantĂ©m a ownership das entradas.

Notas sobre os retornos da pilha:

  • Demonstre que o retorno de somar Ă© barato porque o compilador pode eliminar a operação de cĂłpia. Modifique o cĂłdigo acima para imprimir endereços da pilha e execute-o no Playground ou veja o cĂłdigo assembly em Godbolt. No nĂ­vel de otimização “DEBUG”, os endereços devem mudar, enquanto eles permanecem os mesmos quando a configuração Ă© alterada para “RELEASE”:

    #[derive(Debug)]
    struct Point(i32, i32);
    
    fn add(p1: &Point, p2: &Point) -> Point {
        let p = Point(p1.0 + p2.0, p1.1 + p2.1);
        println!("&p.0: {:p}", &p.0);
        p
    }
    
    pub fn main() {
        let p1 = Point(3, 4);
        let p2 = Point(10, 20);
        let p3 = add(&p1, &p2);
        println!("&p3.0: {:p}", &p3.0);
        println!("{p1:?} + {p2:?} = {p3:?}");
    }
  • O compilador Rust pode fazer otimização de valor de retorno (Return Value Operation - RVO).

  • Em C++, a elisĂŁo (omissĂŁo) de cĂłpia deve ser definida na especificação da linguagem porque os construtores podem ter efeitos colaterais. Em Rust, isso nĂŁo Ă© um problema. Se o RVO nĂŁo aconteceu, o Rust sempre executarĂĄ uma cĂłpia memcpy simples e eficiente.

EmprĂ©stimos Compartilhados e Únicos

O Rust coloca restriçÔes nas formas como vocĂȘ pode emprestar valores:

  • VocĂȘ pode ter um ou mais valores &T a qualquer momento, ou
  • VocĂȘ pode ter exatamente um valor &mut T.
fn main() {
    let mut a: i32 = 10;
    let b: &i32 = &a;

    {
        let c: &mut i32 = &mut a;
        *c = 20;
    }

    println!("a: {a}");
    println!("b: {b}");
}
  • O cĂłdigo acima nĂŁo compila porque a Ă© emprestado como mutĂĄvel (atravĂ©s de c) e como imutĂĄvel (atravĂ©s de b) ao mesmo tempo.
  • Mova a instrução println! para b antes do escopo que introduz c para fazer o cĂłdigo compilar.
  • ApĂłs essa alteração, o compilador percebe que b sĂł Ă© usado antes do novo emprĂ©stimo mutĂĄvel de a atravĂ©s de c. Este Ă© um recurso do verificador de emprĂ©stimo (borrow checker) chamado “tempos de vida nĂŁo lexicais”.

Tempos de Vida (Lifetimes)

Um valor emprestado tem um tempo de vida (lifetime):

  • O tempo de vida pode ser implĂ­cito: add(p1: &Point, p2: &Point) -> Point.
  • Tempos de vida tambĂ©m podem ser explĂ­citos: &'a Point, &'documento str.
  • Leia &'a Point como “um Point emprestado que Ă© vĂĄlido por pelo menos o tempo de vida a”.
  • Tempos de vida sĂŁo sempre inferidos pelo compilador: vocĂȘ nĂŁo pode atribuir um tempo de vida vocĂȘ mesmo.
    • AnotaçÔes de tempo de vida criam restriçÔes; o compilador verifica se hĂĄ uma solução vĂĄlida.
  • Tempos de vida para argumentos de função e valores de retorno precisam ser completamente especificados, mas o Rust permite que eles sejam omitidos na maioria das vezes com algumas regras simples.

Tempos de vida (Lifetimes) em Chamadas de Função

Além de emprestar seus argumentos, uma função pode retornar um valor emprestado:

#[derive(Debug)]
struct Point(i32, i32);

fn left_most<'a>(p1: &'a Point, p2: &'a Point) -> &'a Point {
    if p1.0 < p2.0 { p1 } else { p2 }
}

fn main() {
    let p1: Point = Point(10, 10);
    let p2: Point = Point(20, 20);
    let p3: &Point = left_most(&p1, &p2);
    println!("Ponto mais Ă  esquerda: {:?}", p3);
}
  • 'a Ă© um parĂąmetro genĂ©rico, ele Ă© inferido pelo compilador.
  • Os tempos de vida começam com ' e 'a Ă© um name padrĂŁo tĂ­pico.
  • Leia &'a Point como “um Point emprestado que Ă© vĂĄlido por pelo menos o tempo de vida a”.
    • A parte pelo menos Ă© importante quando os parĂąmetros estĂŁo em escopos diferentes.

No exemplo acima, tente o seguinte:

  • Mova a declaração de p2 e p3 para um novo escopo ({ ... }), resultando no seguinte cĂłdigo:

    #[derive(Debug)]
    struct Point(i32, i32);
    
    fn left_most<'a>(p1: &'a Point, p2: &'a Point) -> &'a Point {
        if p1.0 < p2.0 { p1 } else { p2 }
    }
    
    fn main() {
        let p1: Point = Point(10, 10);
        let p3: &Point;
        {
            let p2: Point = Point(20, 20);
            p3 = left_most(&p1, &p2);
        }
        println!("Ponto mais Ă  esquerda: {:?}", p3);
    }

    Note como isto nĂŁo compila uma vez que p3 vive mais que p2.

  • Reinicie o espaço de trabalho e altere a assinatura da função para fn left_most<'a, 'b>(p1: &'a Point, p2: &'a Point) -> &'b Point. Isso nĂŁo serĂĄ compilado porque a relação entre os tempos de vida 'a e 'b nĂŁo Ă© clara.

  • Outra forma de explicar:

    • Duas referĂȘncias a dois valores sĂŁo emprestadas por uma função e a função retorna outra referĂȘncia.
    • Ela deve ter vindo de uma dessas duas entradas (ou de uma variĂĄvel global).
    • De qual? O compilador precisa saber, de forma que no local da chamada a referĂȘncia retornada nĂŁo seja usada por mais tempo do que uma variĂĄvel de onde veio a referĂȘncia.

Tempos de Vida em Estruturas de Dados

Se um tipo de dados armazena dados emprestados, ele deve ser anotado com um tempo de vida:

#[derive(Debug)]
struct Highlight<'doc>(&'doc str);

fn erase(text: String) {
    println!("Até logo {text}!");
}

fn main() {
    let text = String::from("A raposa marrom ågil pula sobre o cachorro preguiçoso.");
    let fox = Highlight(&text[4..19]);
    let dog = Highlight(&text[35..43]);
    // erase(text);
    println!("{fox:?}");
    println!("{dog:?}");
}
  • No exemplo acima, a anotação em Highlight impĂ”e que os dados subjacentes ao &str contido vivam pelo menos tanto quanto qualquer instĂąncia de Highlight que use esses dados.
  • Se text for consumido antes do final do tempo de vida de fox (ou dog), o verificador de emprĂ©stimo lançarĂĄ um erro.
  • Tipos com dados emprestados forçam os usuĂĄrios a manter os dados originais. Isso pode ser Ăștil para criar exibiçÔes leves, mas geralmente as tornam um pouco mais difĂ­ceis de usar.
  • Quando possĂ­vel, faça com que as estruturas de dados possuam (own) seus dados diretamente.
  • Algumas structs com mĂșltiplas referĂȘncias internas podem ter mais de uma anotação de tempo de vida. Isso pode ser necessĂĄrio se houver a necessidade de descrever-se relacionamentos de tempo de vida entre as prĂłprias referĂȘncias, alĂ©m do tempo de vida da prĂłpria struct. Esses sĂŁo casos de uso bastante avançados.

Dia 2: ExercĂ­cios Matinais

Veremos a implementação de métodos em dois contextos:

  • Uma struct simples que guarda estatĂ­sticas de saĂșde.

  • VĂĄrias structs e enums para uma biblioteca de desenho.

Depois de ver os exercĂ­cios, vocĂȘ pode ver as soluçÔes fornecidas.

Armazenando Livros

NĂłs iremos aprender muito mais sobre structs e o tipo Vec<T> amanhĂŁ. Por hora, vocĂȘ sĂł precisa conhecer parte de sua API:

fn main() {
    let mut vec = vec![10, 20];
    vec.push(30);
    let midpoint = vec.len() / 2;
    println!("valor do meio: {}", vec[midpoint]);
    for item in &vec {
        println!("item: {item}");
    }
}

Use isto para modelar uma coleção de livros de uma biblioteca. Copie o código abaixo para https://play.rust-lang.org/ e atualize os tipos para compilar:

struct Library {
    books: Vec<Book>,
}

struct Book {
    title: String,
    year: u16,
}

impl Book {
    // Este Ă© um construtor, utilizado abaixo.
    fn new(title: &str, year: u16) -> Book {
        Book {
            title: String::from(title),
            year,
        }
    }
}

// Implemente os métodos abaixo. Atualize o parùmetro `self` para
// indicar o nĂ­vel requerido de ownership sobre o objeto:
//
// - `&self` para acesso compartilhado de apenas leitura,
// - `&mut self` para acesso mutĂĄvel exclusivo,
// - `self` para acesso exclusivo por valor.
impl Library {
    fn new() -> Library {
        todo!("Inicialize e retorne um valor `Biblioteca`")
    }

    //fn tamanho(self) -> usize {
    //    todo!("Retorne o tamanho de `self.livros`")
    //}

    //fn esta_vazia(self) -> bool {
    //    todo!("Retorne `true` se `self.livros` for vazio")
    //}

    //fn adicionar_livro(self, book: Livro) {
    //    todo!("Adicione um novo livro em `self.livros`")
    //}

    //fn imprimir_livros(self) {
    //    todo!("Itere sobre `self.livros` e sobre o tĂ­tulo e ano de cada livro")
    //}

    //fn livro_mais_antigo(self) -> Option<&Livro> {
    //    todo!("Retorne uma referĂȘncia para o livro mais antigo (se houver)")
    //}
}

// Isto demonstra o comportamento esperado. Descomente o cĂłdigo abaixo e
// implemente os mĂ©todos que faltam. VocĂȘ precisarĂĄ atualizar as
// assinaturas dos mĂ©todos, incluindo o parĂąmetro "self"! VocĂȘ talvez
// precise atualizar as atribuiçÔes de variåvel dentro de `main()`.
fn main() {
    let library = Library::new();

    //println!("A biblioteca estĂĄ vazia: biblioteca.esta_vazia() -> {}", biblioteca.esta_vazia());
    //
    //biblioteca.adicionar_livro(Livro::new("Lord of the Rings", 1954));
    //biblioteca.adicionar_livro(Livro::new("Alice's Adventures in Wonderland", 1865));
    //
    //println!("The biblioteca nĂŁo estĂĄ mais vazia: biblioteca.esta_vazia() -> {}", biblioteca.esta_vazia());
    //
    //
    //biblioteca.imprimir_livros();
    //
    //match biblioteca.livro_mais_antigo() {
    //    Some(livro) => println!("O livro mais antigo Ă© {}", livro.titulo),
    //    None => println!("A biblioteca estĂĄ vazia!"),
    //}
    //
    //println!("The biblioteca tem {} livros", biblioteca.tamanho());
    //biblioteca.imprimir_livros();
}

SoluçÔes

Iteradores e Ownership (Posse)

O modelo de ownership do Rust afeta muitas APIs. Um exemplo disso sĂŁo os traits Iterator e IntoIterator.

Iterator (Iterador)

Os traits sĂŁo como interfaces: eles descrevem o comportamento (mĂ©todos) para um tipo. O trait Iterator simplesmente diz que vocĂȘ pode chamar next atĂ© obter None como retorno:

#![allow(unused)]
fn main() {
pub trait Iterator {
    type Item;
    fn next(&mut self) -> Option<Self::Item>;
}
}

VocĂȘ usa esse trait da seguinte forma:

fn main() {
    let v: Vec<i8> = vec![10, 20, 30];
    let mut iter = v.iter();

    println!("v[0]: {:?}", iter.next());
    println!("v[1]: {:?}", iter.next());
    println!("v[2]: {:?}", iter.next());
    println!("Sem mais itens: {:?}", iter.next());
}

Qual Ă© o tipo retornado pelo iterador? Teste sua resposta aqui:

fn main() {
    let v: Vec<i8> = vec![10, 20, 30];
    let mut iter = v.iter();

    let v0: Option<..> = iter.next();
    println!("v0: {v0:?}");
}

Por que esse tipo?

IntoIterator

O trait Iterator informa como iterar depois de criar um iterador. O trait relacionado IntoIterator lhe informa como criar o iterador:

#![allow(unused)]
fn main() {
pub trait IntoIterator {
    type Item;
    type IntoIter: Iterator<Item = Self::Item>;

    fn into_iter(self) -> Self::IntoIter;
}
}

A sintaxe aqui significa que toda implementação de IntoIterator deve declarar dois tipos:

  • Item: o tipo sobre o qual iteramos, como i8,
  • IntoIter: o tipo Iterator retornado pelo mĂ©todo into_iter.

Observe que IntoIter e Item estĂŁo vinculados: o iterador deve ter o mesmo tipo Item, o que significa que ele retorna Option<Item>

Como antes, qual Ă© o tipo retornado pelo iterador?

fn main() {
    let v: Vec<String> = vec![String::from("foo"), String::from("bar")];
    let mut iter = v.into_iter();

    let v0: Option<..> = iter.next();
    println!("v0: {v0:?}");
}

Loops for

Agora que conhecemos Iterator e IntoIterator, podemos construir loops for. Eles chamam into_iter() em uma expressĂŁo e itera sobre o iterador resultante:

fn main() {
    let v: Vec<String> = vec![String::from("foo"), String::from("bar")];

    for word in &v {
        println!("palavra: {word}");
    }

    for word in v {
        println!("palavra: {word}");
    }
}

Qual é o tipo de palavra em cada laço?

Experimente com o código acima e depois consulte a documentação para impl IntoIterator para &Vec<T> e impl IntoIterator para Vec<T> para verificar suas respostas.

Structs

Como C e C++, Rust tem suporte para structs personalizadas:

struct Person {
    name: String,
    age: u8,
}

fn main() {
    let mut peter = Person {
        name: String::from("Pedro"),
        age: 27,
    };
    println!("{} tem {} anos.", peter.name, peter.age);
    
    peter.age = 28;
    println!("{} tem {} anos.", peter.name, peter.age);
    
    let jackie = Person {
        name: String::from("Jackie"),
        ..peter
    };
    println!("{} tem {} anos.", jackie.name, jackie.age);
}

Pontos Chave:

  • Structs funcionam como em C ou C++.
    • Como em C++, e ao contrĂĄrio de C, nenhum typedef Ă© necessĂĄrio para definir um tipo.
    • Ao contrĂĄrio do C++, nĂŁo hĂĄ herança entre structs.
  • Os mĂ©todos sĂŁo definidos em um bloco impl, que veremos nos prĂłximos slides.
  • Este pode ser um bom momento para que as pessoas saibam que existem diferentes tipos de structs.
    • Structs de tamanho zero por exemplo, struct Foo; podem ser usadas ao implementar uma caracterĂ­stica em algum tipo, mas nĂŁo possuem nenhum dado que vocĂȘ deseja armazenar nelas.
    • O prĂłximo slide apresentarĂĄ as estruturas tuplas (Estruturas Tupla) usadas quando o nome dos campos nĂŁo sĂŁo importantes.
  • A sintaxe ..pedro permite copiar a maioria dos campos de uma struct sem precisar explicitar seus tipos. Sempre deve ser o Ășltimo elemento.

Estruturas de Tuplas (Tuple Structs)

Se os nomes dos campos nĂŁo forem importantes, vocĂȘ pode usar uma estrutura de tupla:

struct Point(i32, i32);

fn main() {
    let p = Point(17, 23);
    println!("({}, {})", p.0, p.1);
}

Isso Ă© comumente utilizado para wrappers (invĂłlucros) com campo Ășnico (chamados newtypes):

struct PoundsOfForce(f64);
struct Newtons(f64);

fn compute_thruster_force() -> PoundsOfForce {
    todo!("Pergunte para um cientista de foguetes da NASA")
}

fn set_thruster_force(force: Newtons) {
    // 

}

fn main() {
    let force = compute_thruster_force();
    set_thruster_force(force);
}
  • Newtypes sĂŁo uma Ăłtima maneira de codificar informaçÔes adicionais sobre o valor em um tipo primitivo, por exemplo:
    • O nĂșmero Ă© medido em algumas unidades: Newtons no exemplo acima.
    • O valor passou por alguma validação quando foi criado, entĂŁo nĂŁo Ă© preciso validĂĄ-lo novamente a cada uso: NumeroTelefone(String) ou NumeroImpar(u32).
  • Demonstre como somar um valor f64 em um valor do tipo Newtons acessando o campo Ășnico no newtype.
    • Geralmente, Rust nĂŁo gosta de coisas implĂ­citas, como unwrapping automĂĄtico ou, por exemplo, usar booleanos como inteiros.
    • Sobrecarga de operadores Ă© discutido no Dia 3 (generics).
  • O examplo Ă© uma referĂȘncia sutil a falha do Orbitador ClimĂĄtico de Marte.

Sintaxe Abreviada de Campos

Se vocĂȘ jĂĄ tiver variĂĄveis com os nomes corretos, poderĂĄ criar a estrutura (struct) usando uma abreviação:

#[derive(Debug)]
struct Person {
    name: String,
    age: u8,
}

impl Person {
    fn new(name: String, age: u8) -> Person {
        Person { name, age }
    }
}

fn main() {
    let peter = Person::new(String::from("Pedro"), 27);
    println!("{peter:?}");
}
  • A função new poderia ser escrita utilizando Self como tipo, jĂĄ que ele Ă© intercambiĂĄvel com o nome da struct

    #[derive(Debug)]
    struct Person {
        name: String,
        age: u8,
    }
    impl Person {
        fn new(name: String, age: u8) -> Self {
            Self { name, age }
        }
    }
  • Implemente a trait Default (PadrĂŁo) para a struct. Defina alguns campos e utilize valores padrĂŁo para os demais.

    #[derive(Debug)]
    struct Person {
        name: String,
        age: u8,
    }
    impl Default for Person {
        fn default() -> Person {
            Person {
                name: "RobĂŽ".to_string(),
                age: 0,
            }
        }
    }
    fn create_default() {
        let tmp = Person {
            ..Person::default()
        };
        let tmp = Person {
            name: "Sam".to_string(),
            ..Person::default()
        };
    }
  • MĂ©todos sĂŁo definidos no bloco impl.

  • Use a sintaxe de atualização de estruturas para definir uma nova struct usando peter. Note que a variĂĄvel peter nĂŁo serĂĄ mais acessĂ­vel apĂłs.

  • Utilize {:#?} para imprimir structs utilizando a representação de depuração (Debug).

MĂ©todos

Rust permite que vocĂȘ associe funçÔes aos seus novos tipos. VocĂȘ faz isso com um bloco impl:

#[derive(Debug)]
struct Person {
    name: String,
    age: u8,
}

impl Person {
    fn say_hello(&self) {
        println!("OlĂĄ, meu nome Ă© {}", self.name);
    }
}

fn main() {
    let peter = Person {
        name: String::from("Pedro"),
        age: 27,
    };
    peter.say_hello();
}

Pontos Chave:

  • Pode ser Ăștil introduzir mĂ©todos comparando-os com funçÔes.
    • MĂ©todos sĂŁo chamados em uma instĂąncia de um tipo (como struct ou enum), o primeiro parĂąmetro representa a instĂąncia como self.
    • Os desenvolvedores podem optar por usar mĂ©todos para aproveitar a sintaxe do receptor do mĂ©todo e ajudar a mantĂȘ-los mais organizados. Usando mĂ©todos, podemos manter todo o cĂłdigo de implementação em um local previsĂ­vel.
  • Destaque o uso da palavra-chave self, um receptor de mĂ©todo.
    • Mostre que Ă© um termo abreviado para self:Self e talvez mostre como o nome da struct tambĂ©m poderia ser usado.
    • Explique que Self Ă© um apelido de tipo para o tipo em que o bloco impl estĂĄ e pode ser usado em qualquer outro lugar no bloco.
    • Observe como self Ă© usado como outras Structs e a notação de ponto pode ser usada para se referir a campos individuais.
    • Este pode ser um bom momento para demonstrar como &self difere de self modificando o cĂłdigo e tentando executar dizer_ola duas vezes.
  • Descreveremos a distinção entre os receptores de mĂ©todo a seguir.

Receptor de MĂ©todo

O &self acima indica que o método toma emprestado o objeto imutavelmente. Existem outros receptores possíveis para um método:

  • &self: pega emprestado o objeto do chamador como uma referĂȘncia compartilhada e imutĂĄvel. O objeto pode ser usado novamente depois.
  • &mut self: pega emprestado o objeto do chamador como uma referĂȘncia Ășnica e mutĂĄvel. O objeto pode ser usado novamente depois.
  • self: toma posse do objeto e o move do chamador. O mĂ©todo se torna o proprietĂĄrio do objeto. O objeto serĂĄ descartado (desalocado) quando o mĂ©todo retorna, a menos que sua ownership (posse) seja explicitamente transmitida. Posse completa nĂŁo significa automaticamente mutabilidade.
  • mut self: o mesmo que acima, mas enquanto o mĂ©todo possui o objeto, ele pode alterĂĄ-lo tambĂ©m.
  • Sem receptor: isso se torna um mĂ©todo estĂĄtico (static) na estrutura. Normalmente usado para criar construtores que, por convenção, sĂŁo chamados new.

Além das variantes de self, também existem tipos especiais de wrapper que podem ser tipos de receptores, como Box<Self>.

Considere enfatizar “compartilhado e imutĂĄvel” e “Ășnico e mutĂĄvel”. Essas restriçÔes sempre vĂȘm juntos no Rust devido Ă s regras do Borrow Checker (verificador de emprĂ©stimo), e self nĂŁo Ă© uma exceção. NĂŁo serĂĄ possĂ­vel referenciar uma struct de vĂĄrios locais e chamar um mĂ©todo mutĂĄvel (&mut self) nela.

Exemplo

#[derive(Debug)]
struct Race {
    name: String,
    laps: Vec<i32>,
}

impl Race {
    fn new(name: &str) -> Race {  // Sem receptor, método eståtico
        Race { name: String::from(name), laps: Vec::new() }
    }

    fn add_lap(&mut self, lap: i32) {  // EmprĂ©stimo Ășnico com acesso de leitura e escrita em self
        self.laps.push(lap);
    }

    fn print_laps(&self) {  // Empréstimo compartilhado com acesso apenas de leitura em self
        println!("Registrou {} voltas para {}:", self.laps.len(), self.name);
        for (idx, lap) in self.laps.iter().enumerate() {
            println!("Volta {idx}: {lap} seg");
        }
    }

    fn finish(self) {  // Propriedade exclusiva de self
        let total = self.laps.iter().sum::<i32>();
        println!("Corrida {} foi encerrada, tempo de voltas total: {}", self.name, total);
    }
}

fn main() {
    let mut race = Race::new("Monaco Grand Prix");
    race.add_lap(70);
    race.add_lap(68);
    race.print_laps();
    race.add_lap(71);
    race.print_laps();
    race.finish();
    // race.add_lap(42);
}

Pontos Chave:

  • Todos os quatro mĂ©todos aqui usam um receptor de mĂ©todo diferente.
    • VocĂȘ pode apontar como isso muda o que a função pode fazer com os valores das variĂĄveis e se/como ela pode ser usada novamente na main.
    • VocĂȘ pode mostrar o erro que aparece ao tentar chamar encerrar duas vezes.
  • Observe que, embora os receptores do mĂ©todo sejam diferentes, as funçÔes nĂŁo estĂĄticas sĂŁo chamadas da mesma maneira no corpo principal. Rust permite referenciar e desreferenciar automaticamente ao chamar mĂ©todos. Rust adiciona automaticamente &, *, muts para que esse objeto corresponda Ă  assinatura do mĂ©todo.
  • VocĂȘ pode apontar que imprimir_voltas estĂĄ usando um vetor e iterando sobre ele. Descreveremos os vetores com mais detalhes Ă  tarde.

Dia 2: ExercĂ­cios da Tarde

Os exercĂ­cios desta tarde se concentrarĂŁo em strings e iteradores.

Depois de ver os exercĂ­cios, vocĂȘ pode ver as soluçÔes fornecidas.

EstatĂ­sticas de SaĂșde

VocĂȘ estĂĄ trabalhando na implementação de um sistema de monitoramento de saĂșde. Como parte disso, vocĂȘ precisa acompanhar as estatĂ­sticas de saĂșde dos usuĂĄrios.

VocĂȘ começarĂĄ com algumas funçÔes fragmentadas em um bloco impl e tambĂ©m com a definição da estrutura Usuario. Seu objetivo Ă© implementar os mĂ©todos esboçados para a struct Usuario definidos no bloco impl.

Copie o código abaixo em https://play.rust-lang.org/ e implemente os métodos que estão faltando:

// TODO: remova isto quando vocĂȘ terminar sua implementação .
#![allow(unused_variables, dead_code)]

pub struct User {
    name: String,
    age: u32,
    height: f32,
    visit_count: usize,
    last_blood_pressure: Option<(u32, u32)>,
}

pub struct Measurements {
    height: f32,
    blood_pressure: (u32, u32),
}

pub struct HealthReport<'a> {
    patient_name: &'a str,
    visit_count: u32,
    height_change: f32,
    blood_pressure_change: Option<(i32, i32)>,
}

impl User {
    pub fn new(name: String, age: u32, height: f32) -> Self {
        unimplemented!()
    }

    pub fn name(&self) -> &str {
        unimplemented!()
    }

    pub fn age(&self) -> u32 {
        unimplemented!()
    }

    pub fn height(&self) -> f32 {
        unimplemented!()
    }

    pub fn doctor_visits(&self) -> u32 {
        unimplemented!()
    }

    pub fn set_age(&mut self, new_age: u32) {
        unimplemented!()
    }

    pub fn set_height(&mut self, new_height: f32) {
        unimplemented!()
    }

    pub fn visit_doctor(&mut self, measurements: Measurements) -> HealthReport {
        unimplemented!()
    }
}

fn main() {
    let bob = User::new(String::from("Bob"), 32, 155.2);
    println!("I'm {} and my age is {}", bob.name(), bob.age());
}

#[test]
fn test_height() {
    let bob = User::new(String::from("Bob"), 32, 155.2);
    assert_eq!(bob.height(), 155.2);
}

#[test]
fn test_set_age() {
    let mut bob = User::new(String::from("Bob"), 32, 155.2);
    assert_eq!(bob.age(), 32);
    bob.set_age(33);
    assert_eq!(bob.age(), 33);
}

#[test]
fn test_visit() {
    let mut bob = User::new(String::from("Bob"), 32, 155.2);
    assert_eq!(bob.doctor_visits(), 0);
    let report = bob.visit_doctor(Measurements {
        height: 156.1,
        blood_pressure: (120, 80),
    });
    assert_eq!(report.patient_name, "Bob");
    assert_eq!(report.visit_count, 1);
    assert_eq!(report.blood_pressure_change, None);

    let report = bob.visit_doctor(Measurements {
        height: 156.1,
        blood_pressure: (115, 76),
    });

    assert_eq!(report.visit_count, 2);
    assert_eq!(report.blood_pressure_change, Some((-5, -4)));
}

Biblioteca PadrĂŁo

Rust vem com uma biblioteca padrĂŁo (standard library) que ajuda a estabelecer um conjunto de tipos comuns usados por bibliotecas e programas Rust. Dessa forma, duas bibliotecas podem trabalhar juntas sem problemas porque ambas usam o mesmo tipo String.

Os tipos de vocabulĂĄrio comuns incluem:

  • Option e Result: tipos usados para valores opcionais e tratamento de erro.

  • String: o tipo de string padrĂŁo usado para dados owned.

  • Vec: um vetor extensĂ­vel padrĂŁo.

  • HashMap: um tipo de mapa de hash com um algoritmo de hash configurĂĄvel.

  • Box: um ponteiro owned para dados alocados em heap.

  • Rc: um ponteiro de contagem de referĂȘncia compartilhado para dados alocados em heap.

  • Na verdade, o Rust contĂ©m vĂĄrias camadas de Biblioteca PadrĂŁo: core, alloc e std.
  • core inclui os tipos e funçÔes mais bĂĄsicos que nĂŁo dependem de libc, alocador ou atĂ© mesmo a presença de um sistema operacional.
  • alloc inclui tipos que requerem um alocador de heap global, como Vec, Box e Arc.
  • Os aplicativos Rust embarcados geralmente usam apenas core e, Ă s vezes, alloc.

Option e Result

Os tipos representam dados opcionais:

fn main() {
    let numbers = vec![10, 20, 30];
    let first: Option<&i8> = numbers.first();
    println!("primeiro: {first:?}");

    let idx: Result<usize, usize> = numbers.binary_search(&10);
    println!("ind: {idx:?}");
}
  • Option e Result sĂŁo amplamente usados nĂŁo apenas na biblioteca padrĂŁo.
  • Option<&T> nĂŁo tem nenhum custo adicional de espaço em comparação com &T.
  • Result Ă© o tipo padrĂŁo para implementar tratamento de erros, como veremos no Dia 3.
  • binary_search retorna Result<usize, usize>.
    • Se encontrado, Result::Ok contĂ©m o Ă­ndice onde o elemento foi encontrado.
    • Caso contrĂĄrio, Result::Err contĂ©m o Ă­ndice onde tal elemento deve ser inserido.

String

String Ă© o buffer padrĂŁo de cadeia de caracteres UTF-8 expansĂ­vel e alocado no heap:

fn main() {
    let mut s1 = String::new();
    s1.push_str("OlĂĄ");
    println!("s1: tam = {}, capacidade = {}", s1.len(), s1.capacity());

    let mut s2 = String::with_capacity(s1.len() + 1);
    s2.push_str(&s1);
    s2.push('!');
    println!("s2: tam = {}, capacidade = {}", s2.len(), s2.capacity());

    let s3 = String::from("đŸ‡§đŸ‡·");
    println!("s3: tam = {}, nĂșmero de caracteres = {}", s3.len(),
             s3.chars().count());
}

String implementa Deref<Target = str>, o que significa que vocĂȘ pode chamar todos os mĂ©todos de str em uma String.

  • String::new retorna uma nova string vazia, use String::with_capacity quando vocĂȘ sabe a quantidade de dados que vocĂȘ deseja colocar na string.
  • String::len retorna o tamanho da String em bytes (que pode ser diferente de seu comprimento em caracteres).
  • String::chars retorna um iterador com os caracteres de fato. Observe que um char pode ser diferente do que um humano considerarĂĄ um “caracter” devido a agrupamentos de grafemas (grapheme clusters).
  • Quando as pessoas se referem a strings, elas podem estar falando sobre &str ou String.
  • Quando um tipo implementa Deref<Target = T>, o compilador permitirĂĄ que vocĂȘ transparentemente chame mĂ©todos de T.
    • String implementa Deref<Target = str> que, de forma transparente, dĂĄ acesso aos mĂ©todos de str.
    • Escreva e compare let s3 = s1.deref(); e let s3 = &*s1;.
  • String Ă© implementado como um wrapper em torno de um vetor de bytes, muitas das operaçÔes que vocĂȘ vĂȘ suportados em vetores tambĂ©m sĂŁo suportadas em String, mas com algumas garantias extras.
  • Compare as diferentes formas de indexar uma String:
    • Para um caracter usando s3.chars().nth(i).unwrap() onde i estĂĄ dentro dos limites, fora dos limites.
    • Para uma substring usando s3[0..4], onde essa slice estĂĄ nos limites dos caracteres ou nĂŁo.

Vec

Vec Ă© o buffer padrĂŁo redimensionĂĄvel alocado no heap:

fn main() {
    let mut v1 = Vec::new();
    v1.push(42);
    println!("v1: tamanho = {}, capacidade = {}", v1.len(), v1.capacity());

    let mut v2 = Vec::with_capacity(v1.len() + 1);
    v2.extend(v1.iter());
    v2.push(9999);
    println!("v2: tamanho = {}, capacidade = {}", v2.len(), v2.capacity());

    // Macro canĂŽnica para inicializar um vetor com elementos.
    let mut v3 = vec![0, 0, 1, 2, 3, 4];

    // Mantém apenas os elementos pares.
    v3.retain(|x| x % 2 == 0);
    println!("{v3:?}");

    // Remove duplicatas consecutivas.
    v3.dedup();
    println!("{v3:?}");
}

Vec implementa Deref<Target = [T]>, o que significa que vocĂȘ pode chamar mĂ©todos de slice em um Vec.

  • Vec Ă© um tipo de coleção, como String e HashMap. Os dados que ele contĂ©m sĂŁo armazenados no heap. Isso significa que a quantidade de dados nĂŁo precisa ser conhecida em tempo de compilação. Ela pode crescer ou encolher em tempo de execução.
  • Observe como Vec<T> tambĂ©m Ă© um tipo genĂ©rico, mas vocĂȘ nĂŁo precisa especificar T explicitamente. Como sempre, com a inferĂȘncia de tipos do Rust, T foi estabelecido durante a primeira chamada de push.
  • vec![...] Ă© uma macro canĂŽnica para usar em vez de Vec::new() e suporta a adição de elementos iniciais ao vetor.
  • Para indexar o vetor, vocĂȘ usa [ ], mas uma exceção do tipo pĂąnico (panic) serĂĄ gerada se o Ă­ndice estiver fora dos limites. Alternativamente, usando get vocĂȘ obterĂĄ um Option. A função pop removerĂĄ o Ășltimo elemento.
  • Mostre uma iteração sobre um vetor e alterando o valor: for e in &mut v { *e += 50; }

HashMap

Hash map (Mapa de hash) padrão com proteção contra ataques HashDoS:

use std::collections::HashMap;

fn main() {
    let mut page_counts = HashMap::new();
    page_counts.insert("Adventures of Huckleberry Finn".to_string(), 207);
    page_counts.insert("Grimms' Fairy Tales".to_string(), 751);
    page_counts.insert("Pride and Prejudice".to_string(), 303);

    if !page_counts.contains_key("Les Misérables") {
        println!("Nós sabemos sobre livros {}, mas não Les Misérables.",
                 page_counts.len());
    }

    for book in ["Pride and Prejudice", "Alice's Adventure in Wonderland"] {
        match page_counts.get(book) {
            Some(count) => println!("{book}: {count} pĂĄginas"),
            None => println!("{book} Ă© desconhecido.")
        }
    }

    // Use o método .entry() para inserir um valor caso nada seja encontrado.
    for book in ["Pride and Prejudice", "Alice's Adventure in Wonderland"] {
        let page_count: &mut i32 = page_counts.entry(book.to_string()).or_insert(0);
        *page_count += 1;
    }

    println!("{page_counts:#?}");
}
  • HashMap nĂŁo estĂĄ definido no prelĂșdio e precisa ser incluĂ­do no escopo.

  • Tente as seguintes linhas de cĂłdigo. A primeira linha verĂĄ se um livro estĂĄ no hash map e, caso nĂŁo esteja, retorna um valor alternativo. A segunda linha irĂĄ inserir o valor alternativo no hash map se o livro nĂŁo for encontrado.

      let pc1 = page_counts
          .get("Harry Potter and the Sorcerer's Stone ")
          .unwrap_or(&336);
      let pc2 = page_counts
          .entry("The Hunger Games".to_string())
          .or_insert(374);
  • Ao contrĂĄrio de vec!, infelizmente nĂŁo existe uma macro hashmap! padrĂŁo.

    • Entretanto, desde o Rust 1.56, o HashMap implementa From<[(K, V); N]>, o que nos permite inicializar facilmente um hash map a partir de uma matriz literal:

        let page_counts = HashMap::from([
          ("Harry Potter and the Sorcerer's Stone".to_string(), 336),
          ("The Hunger Games".to_string(), 374),
        ]);
  • Alternativamente, o HashMap pode ser construĂ­do a partir de qualquer Iterator que produz tuplas de chave-valor.

  • Estamos mostrando HashMap<String, i32>, e evite usar &str como chave para facilitar os exemplos. É claro que o uso de referĂȘncias em coleçÔes pode ser feito, mas isto pode levar a complicaçÔes com o verificador de emprĂ©stimos.

    • Tente remover to_string() do exemplo acima e veja se ele ainda compila. Onde vocĂȘ acha que podemos ter problemas?
  • This type has several “method-specific” return types, such as std::collections::hash_map::Keys. These types often appear in searches of the Rust docs. Show students the docs for this type, and the helpful link back to the keys method.

Box

Box Ă© um ponteiro owned para dados no heap:

fn main() {
    let five = Box::new(5);
    println!("cinco: {}", *five);
}
5StackHeapfive

Box<T> implementa Deref<Target = T>, o que significa que vocĂȘ pode chamar mĂ©todos de T diretamente em um Box<T>.

  • Box Ă© parecido com std::unique_ptr em C++, exceto que ele Ă© garantidamente nĂŁo nulo.
  • No exemplo acima, vocĂȘ pode atĂ© remover o * na instrução println! graças ao Deref.
  • Uma Box Ă© Ăștil quando vocĂȘ:
    • Tem um tipo cujo tamanho nĂŁo estĂĄ disponĂ­vel em tempo de compilação, mas o compilador Rust precisa saber o tamanho exato.
    • Precisa transferir o ownership de um grande volume de dados. Ao invĂ©s de copiar grandes volumes de dados na pilha, eles sĂŁo armazenados usando uma Box no heap e apenas o ponteiro Ă© movido.

Box com Estruturas de Dados Recursivas

Tipos de dados recursivos ou tipos de dados com tamanhos dinĂąmicos precisam usar uma Box:

#[derive(Debug)]
enum List<T> {
    Cons(T, Box<List<T>>),
    Nil,
}

fn main() {
    let list: List<i32> = List::Cons(1, Box::new(List::Cons(2, Box::new(List::Nil))));
    println!("{list:?}");
}
PilhaHeaplistaCons1Cons2Nil
  • Se a Box nĂŁo for usada e tentarmos incorporar uma List diretamente na List, o compilador nĂŁo conseguiria calcular um tamanho fixo da struct na memĂłria (List teria tamanho infinito) .

  • Box resolve esse problema, pois tem o mesmo tamanho de um ponteiro normal e apenas aponta para o prĂłximo elemento da List no heap.

  • Remova o Box na definição de List e mostre o erro de compilação. “Recursive with indirection” (recursivo com indireção) Ă© uma dica para que vocĂȘ talvez queira usar uma Box ou referĂȘncia de alguma forma, ao invĂ©s de armazenar um valor diretamente.

Otimização de Nicho

#[derive(Debug)]
enum List<T> {
    Cons(T, Box<List<T>>),
    Nil,
}

fn main() {
    let list: List<i32> = List::Cons(1, Box::new(List::Cons(2, Box::new(List::Nil))));
    println!("{list:?}");
}

Uma Box nĂŁo pode estar vazia, portanto o ponteiro Ă© sempre vĂĄlido e nĂŁo nulo (null). Isto permite que o compilador otimize o layout da memĂłria:

PilhaHeaplista12null

Rc

Rc Ă© um ponteiro compartilhado com contagem de referĂȘncia. Use-o quando precisar consultar os mesmos dados a partir de vĂĄrios locais:

use std::rc::Rc;

fn main() {
    let mut a = Rc::new(10);
    let mut b = Rc::clone(&a);

    println!("a: {a}");
    println!("b: {b}");
}
  • Veja Arc e Mutex se vocĂȘ estiver em um contexto multi-thread.
  • VocĂȘ pode demover (downgrade) um ponteiro compartilhado para um ponteiro Weak (fraco) para criar ciclos que serĂŁo descartados.
  • O contador do Rc garante que os seus valores contidos sejam vĂĄlidos enquanto houver referĂȘncias.
  • Rc em Rust Ă© como std::shared_ptr em C++.
  • Rc::clone Ă© barato: ele cria um ponteiro para a mesma alocação e aumenta a contagem de referĂȘncia. Ele nĂŁo faz um “clone profundo” (deep clone) e geralmente pode ser ignorado ao procurar problemas de desempenho no cĂłdigo.
  • make_mut realmente clona o valor interno se necessĂĄrio (“clone-on-write”) e retorna uma referĂȘncia mutĂĄvel.
  • Use Rc::strong_count para verificar a contagem de referĂȘncia.
  • Rc::downgrade lhe fornece um objeto contador de referĂȘncias “fraco” (weak)_ para criar ciclos que podem ser apropriadamente descartados (provavelmente combinados com RefCell, no prĂłximo slide).

Cell e RefCell

Cell e RefCell implementam o que Rust chama de mutabilidade interior: mutação de valores em um contexto imutåvel.

Cell Ă© normalmente usado para tipos simples, pois requer copiar ou mover valores. Tipos interiores mais complexos normalmente usam RefCell, que rastreia referĂȘncias compartilhadas e exclusivas em tempo de execução e retorna um pĂąnico (panic) se forem mal utilizadas.

use std::cell::RefCell;
use std::rc::Rc;

#[derive(Debug, Default)]
struct Node {
    value: i64,
    children: Vec<Rc<RefCell<Node>>>,
}

impl Node {
    fn new(value: i64) -> Rc<RefCell<Node>> {
        Rc::new(RefCell::new(Node { value, ..Node::default() }))
    }

    fn sum(&self) -> i64 {
        self.value + self.children.iter().map(|c| c.borrow().sum()).sum::<i64>()
    }
}

fn main() {
    let root = Node::new(1);
    root.borrow_mut().children.push(Node::new(5));
    let subtree = Node::new(10);
    subtree.borrow_mut().children.push(Node::new(11));
    subtree.borrow_mut().children.push(Node::new(12));
    root.borrow_mut().children.push(subtree);

    println!("graph: {root:#?}");
    println!("graph sum: {}", root.borrow().sum());
}
  • Se estivĂ©ssemos usando Cell em vez de RefCell neste exemplo, terĂ­amos que mover o Node para fora do Rc para enviar os filhos e, em seguida, movĂȘ-lo de volta. Isso Ă© seguro porque sempre hĂĄ um, valor nĂŁo referenciado em cell, mas nĂŁo Ă© ergonĂŽmico.
  • Para fazer qualquer coisa com um Node, vocĂȘ deve chamar um mĂ©todo RefCell, geralmente borrow ou borrow_mut.
  • Demonstre que loops de referĂȘncia podem ser criados adicionando root a subtree.children (nĂŁo tente imprimi-lo!).
  • Para demonstrar um pĂąnico em tempo de execução, adicione um fn inc(&mut self) que incrementa self.value e chama o mesmo mĂ©todo em seus filhos. Isso criarĂĄ um pĂąnico na presença do loop de referĂȘncia, com thread 'main' em pĂąnico no 'jĂĄ emprestado: BorrowMutError'.

MĂłdulos

Vimos como os blocos impl nos permitem usar namespaces (espaços de nomes) de funçÔes para um tipo.

Da mesma forma, mod nos permite usar namespaces de tipos e funçÔes:

mod foo {
    pub fn do_something() {
        println!("No mĂłdulo foo");
    }
}

mod bar {
    pub fn do_something() {
        println!("No mĂłdulo bar");
    }
}

fn main() {
    foo::do_something();
    bar::do_something();
}
  • Pacotes (packages) fornecem funcionalidades e incluem um arquivo Cargo.toml que descreve como gerar um pacote com um ou mais crates.
  • Crates sĂŁo arvores de mĂłdulos, onde um crate binĂĄrio cria um executĂĄvel e um crate de biblioteca Ă© compilado em uma biblioteca.
  • MĂłdulos definem organização, escopo e sĂŁo o foco desta seção.

Visibilidade

MĂłdulos sĂŁo limitadores de privacidade:

  • Itens do mĂłdulo sĂŁo privados por padrĂŁo (ocultam detalhes de implementação).
  • Itens paternos e fraternos sĂŁo sempre visĂ­veis.
  • Em outras palavras, se um item Ă© visĂ­vel no mĂłdulo foo, ele Ă© visĂ­vel em todos os descendentes de foo.
mod outer {
    fn private() {
        println!("externo::privado");
    }

    pub fn public() {
        println!("externo::publico");
    }

    mod inner {
        fn private() {
            println!("externo::interno::privado");
        }

        pub fn public() {
            println!("externo::interno::publico");
            super::private();
        }
    }
}

fn main() {
    outer::public();
}
  • Use a palavra reservada pub para tornar mĂłdulos pĂșblicos.

Adicionamente, existem especificadores pub(...) avançados para restringir o escopo de visibilidade pĂșblica.

  • Veja a ReferĂȘncia Rust.
  • A configuração de visibilidade pub(crate) Ă© um padrĂŁo comum.
  • Menos comum, vocĂȘ pode dar visibilidade para um caminho especĂ­fico.
  • Em todo caso, a visibilidade deve ser concedida a um mĂłdulo ancestral (e a todos os seus descendentes).

Caminhos

Caminhos sĂŁo resolvidos da seguinte forma:

  1. Como um caminho relativo:

    • foo ou self::foo referem-se Ă  foo no mĂłdulo atual,
    • super::foo refere-se Ă  foo no mĂłdulo pai.
  2. Como um caminho absoluto:

    • crate::foo refere-se Ă  foo na raiz do crate atual,
    • bar::foo refere-se a foo no crate bar.

Um mĂłdulo pode trazer sĂ­mbolos de outro mĂłdulo para o escopo com use. Normalmente, vocĂȘ verĂĄ algo assim na parte superior de cada mĂłdulo:

use std::collections::HashSet;
use std::mem::transmute;

Hierarquia do Sistema de Arquivos

Omitir o conteĂșdo do mĂłdulo dirĂĄ ao Rust para procurĂĄ-lo em outro arquivo:

mod garden;

Isso diz ao Rust que o conteĂșdo do mĂłdulo jardim pode ser encontrado em src/jardim.rs. Similarmente, um mĂłdulo jardim::vegetais pode ser encontrado em src/jardim/vegetais.rs.

A raiz crate estĂĄ em:

  • src/lib.rs (para um crate de biblioteca)
  • src/main.rs (para um crate binĂĄrio)

MĂłdulos definidos em arquivos tambĂ©m podem ser documentados usando “comentĂĄrios internos de documento” (inner doc comments). Estes documentam o item que os contĂ©m - neste caso, um mĂłdulo.

//! Este módulo implementa o jardim, incluindo uma implementação de germinação
//!  de alto desempenho.

// Re-exporta tipos deste mĂłdulo.
pub use seeds::SeedPacket;
pub use garden::Garden;

/// Semeia os pacotes de semente fornecidos.
pub fn sow(seeds: Vec<SeedPacket>) { todo!() }

/// Colhe os vegetais no jardim que estĂĄ pronto.
pub fn harvest(garden: &mut Garden) { todo!() }
  • Antes do Rust 2018, os mĂłdulos precisavam estar localizados em module/mod.rs ao invĂ©s de module.rs, e esta ainda Ă© uma alternativa funcional para ediçÔes posteriores a 2018.

  • A principal razĂŁo para introduzir nome_de_arquivo.rs como alternativa a nome_de_arquivo/mod.rs foi porque muitos arquivos denominados mod.rs podem ser difĂ­ceis de distinguir em IDEs.

  • O aninhamento mais profundo pode usar pastas, mesmo que o mĂłdulo principal seja um arquivo:

    src/
    ├── main.rs
    ├── top_module.rs
    └── top_module/
        └── sub_module.rs
    
  • O local no qual o Rust irĂĄ procurar por mĂłdulos pode ser alterado por meio de uma diretiva de compilador:

    #[path = "algum/caminho.rs"]
    mod some_module;

    Isto Ă© Ăștil, por exemplo, se vocĂȘ quiser colocar testes para um mĂłdulo em um arquivo chamado algum_modulo_teste.rs, semelhante Ă  convenção em Go.

Dia 2: ExercĂ­cios da Tarde

Os exercĂ­cios desta tarde se concentrarĂŁo em strings e iteradores.

Depois de ver os exercĂ­cios, vocĂȘ pode ver as soluçÔes fornecidas.

Strings e Iteradores

Neste exercĂ­cio, vocĂȘ irĂĄ implementar um componente de roteamento de um servidor web. O servidor estĂĄ configurado com um nĂșmero de prefixos de caminhos que sĂŁo comparados com os caminhos requisitados. Os prefixos de caminho podem conter um caractere curinga que corresponde a um segmento completo. Veja os testes unitĂĄrios abaixo.

Copie o seguinte código para https://play.rust-lang.org/ e faça os testes passarem. Tente evitar alocar um Vec para seus resultados intermediårios:

#![allow(unused)]
fn main() {
// TODO: remova isto quando vocĂȘ terminar sua implementação .
#![allow(unused_variables, dead_code)]

pub fn prefix_matches(prefix: &str, request_path: &str) -> bool {
    unimplemented!()
}

#[test]
fn test_matches_without_wildcard() {
    assert!(prefix_matches("/v1/editores", "/v1/editores"));
    assert!(prefix_matches("/v1/editores", "/v1/editores/abc-123"));
    assert!(prefix_matches("/v1/editores", "/v1/editores/abc/livros"));

    assert!(!prefix_matches("/v1/editores", "/v1"));
    assert!(!prefix_matches("/v1/editores", "/v1/editoresLivros"));
    assert!(!prefix_matches("/v1/editores", "/v1/pai/editores"));
}

#[test]
fn test_matches_with_wildcard() {
    assert!(prefix_matches(
        "/v1/editores/*/livros",
        "/v1/editores/foo/livros"
    ));
    assert!(prefix_matches(
        "/v1/editores/*/livros",
        "/v1/editores/bar/livros"
    ));
    assert!(prefix_matches(
        "/v1/editores/*/livros",
        "/v1/editores/foo/livros/livro1"
    ));

    assert!(!prefix_matches("/v1/editores/*/livros", "/v1/editores"));
    assert!(!prefix_matches(
        "/v1/editores/*/livros",
        "/v1/editores/foo/livrosPorAutor"
    ));
}
}

Bem-vindo ao Dia 3

Hoje, abordaremos alguns tópicos mais avançados em Rust:

  • Traits: deriving traits, default methods, and important standard library traits.

  • Generics: generic data types, generic methods, monomorphization, and trait objects.

  • Error handling: panics, Result, and the try operator ?.

  • Testing: unit tests, documentation tests, and integration tests.

  • Unsafe Rust: raw pointers, static variables, unsafe functions, and extern functions.

Generics

Rust oferece suporte a tipos genéricos, que permitem algoritmos ou estruturas de dados (como ordenação ou årvore binåria) abstrair os tipos de dados usados ou armazenados.

Tipos de Dados Genéricos

VocĂȘ pode usar tipos genĂ©ricos para abstrair o tipo concreto do campo:

#[derive(Debug)]
struct Point<T> {
    x: T,
    y: T,
}

fn main() {
    let integer = Point { x: 5, y: 10 };
    let float = Point { x: 1.0, y: 4.0 };
    println!("{integer:?} e {float:?}");
}
  • Tente declarar uma nova variĂĄvel let p = Point { x: 5, y: 10.0 };.

  • Arrume o cĂłdigo para permitir pontos que tenham elementos de tipos diferentes.

Métodos Genéricos

VocĂȘ pode declarar um tipo genĂ©rico em seu bloco impl:

#[derive(Debug)]
struct Point<T>(T, T);

impl<T> Point<T> {
    fn x(&self) -> &T {
        &self.0  // + 10
    }

    // fn set_x(&mut self, x: T)
}

fn main() {
    let p = Point(5, 10);
    println!("p.x = {}", p.x());
}
  • Pergunta: Por que T Ă© especificado duas vezes em impl<T> Point<T> {}? Isso nĂŁo Ă© redundante?
    • Isso ocorre porque Ă© uma seção de implementação genĂ©rica para tipo genĂ©rico. Eles sĂŁo genĂ©ricos de forma independente.
    • Significa que esses mĂ©todos sĂŁo definidos para qualquer T.
    • É possĂ­vel escrever Impl Point<u32> { .. }.
      • Point ainda Ă© genĂ©rico e vocĂȘ pode usar Point<f64>, mas os mĂ©todos neste bloco sĂł estarĂŁo disponĂ­veis para Point<u32>.

Monomorfização

O código genérico é transformado em código não genérico de acordo com os tipos usados:

fn main() {
    let integer = Some(5);
    let float = Some(5.0);
}

se comporta como se vocĂȘ tivesse escrito

enum Option_i32 {
    Some(i32),
    None,
}

enum Option_f64 {
    Some(f64),
    None,
}

fn main() {
    let integer = Option_i32::Some(5);
    let float = Option_f64::Some(5.0);
}

Esta Ă© uma abstração de custo zero: vocĂȘ obtĂ©m exatamente o mesmo resultado como se tivesse codificado manualmente as estruturas de dados sem utilizar a abstração.

Traits

Rust permite abstrair caracterĂ­sticas dos tipos usando trait. Eles sĂŁo semelhantes a interfaces:

trait Pet {
    fn name(&self) -> String;
}

struct Dog {
    name: String,
}

struct Cat;

impl Pet for Dog {
    fn name(&self) -> String {
        self.name.clone()
    }
}

impl Pet for Cat {
    fn name(&self) -> String {
        String::from("Gato") // Sem nomes, gatos nĂŁo respondem mesmo.
    }
}

fn greet<P: Pet>(pet: &P) {
    println!("Quem Ă©? É o {}!", pet.name());
}

fn main() {
    let fido = Dog { name: "Bidu".into() };
    greet(&fido);

    let captain_floof = Cat;
    greet(&captain_floof);
}

Objetos Trait

Objetos trait permitem valores de diferentes tipos, por exemplo, em uma coleção:

trait Pet {
    fn name(&self) -> String;
}

struct Dog {
    name: String,
}

struct Cat;

impl Pet for Dog {
    fn name(&self) -> String {
        self.name.clone()
    }
}

impl Pet for Cat {
    fn name(&self) -> String {
        String::from("Gato") // Sem nomes, gatos nĂŁo respondem mesmo.
    }
}

fn main() {
    let pets: Vec<Box<dyn Pet>> = vec![
        Box::new(Cat),
        Box::new(Dog { name: String::from("Bidu") }),
    ];
    for pet in pets {
        println!("OlĂĄ {}!", pet.name());
    }
}

Layout da memĂłria apĂłs alocar pets:

nome:Bidu<Cachorro as Pet>::nome<Gato as Pet>::nomePilhaHeappetsptrtamanho2capac.2
  • Tipos que implementam um dado trait podem ter tamanhos diferentes. Isto torna impossĂ­vel haver coisas como Vec<Pet> no exemplo anterior.
  • dyn Pet Ă© uma maneira de dizer ao compilador sobre um tipo de tamanho dinĂąmico que implementa Pet.
  • No exemplo, pets possui fat pointers para objetos que implementam Pet. O fat pointer consiste em dois componentes, um ponteiro para o objeto propriamente dito e um ponteiro para a tabela de mĂ©todos virtuais para a implementação de Pet do objeto em particular.
  • Compare estas saĂ­das no exemplo anterior::
        println!("{} {}", std::mem::size_of::<Dog>(), std::mem::size_of::<Cat>());
        println!("{} {}", std::mem::size_of::<&Dog>(), std::mem::size_of::<&Cat>());
        println!("{}", std::mem::size_of::<&dyn Pet>());
        println!("{}", std::mem::size_of::<Box<dyn Pet>>());

Traits Derivados

As macros derive do Rust funcionam gerando automaticamente o cĂłdigo que implementa os traits especificados para uma estrutura de dados.

VocĂȘ pode deixar o compilador derivar uma sĂ©rie de traits tais como:

#[derive(Debug, Clone, PartialEq, Eq, Default)]
struct Player {
    name: String,
    strength: u8,
    hit_points: u8,
}

fn main() {
    let p1 = Player::default();
    let p2 = p1.clone();
    println!("{:?} Ă©\nigual a {:?}?\nA resposta Ă© {}!", &p1, &p2,
             if p1 == p2 { "sim" } else { "nĂŁo" });
}

MĂ©todos PadrĂŁo

Traits podem implementar o comportamento em termos de outros métodos de trait:

trait Equals {
    fn equals(&self, other: &Self) -> bool;
    fn not_equals(&self, other: &Self) -> bool {
        !self.equals(other)
    }
}

#[derive(Debug)]
struct Centimeter(i16);

impl Equals for Centimeter {
    fn equals(&self, other: &Centimeter) -> bool {
        self.0 == other.0
    }
}

fn main() {
    let a = Centimeter(10);
    let b = Centimeter(20);
    println!("{a:?} igual a {b:?}: {}", a.equals(&b));
    println!("{a:?} diferente de {b:?}: {}", a.not_equals(&b));
}
  • Traits podem especificar mĂ©todos prĂ©-implementados (padrĂŁo) e mĂ©todos que os usuĂĄrios sĂŁo obrigados a implementar. Os mĂ©todos com implementaçÔes padrĂŁo podem contar com os mĂ©todos requeridos.

  • Mova o mĂ©todo not_equals para um novo trait NotEquals.

  • Faça Equals um super trait para NotEquals.

    trait NotEquals: Equals {
        fn not_equals(&self, other: &Self) -> bool {
            !self.equals(other)
        }
    }
  • Forneça uma implementação geral de NotEquals para Equals.

    trait NotEquals {
        fn not_equals(&self, other: &Self) -> bool;
    }
    
    impl<T> NotEquals for T where T: Equals {
        fn not_equals(&self, other: &Self) -> bool {
            !self.equals(other)
        }
    }
    • Com a implementação geral, vocĂȘ nĂŁo precisa mais de Equals como um super trait para NotEqual.

Limites de trait

Ao trabalhar com genĂ©ricos, muitas vezes vocĂȘ exigir que os tipos implementem algum trait para poder utilizar os mĂ©todos do trait.

VocĂȘ consegue fazer isso com T:Trait ou impl Trait:

fn duplicate<T: Clone>(a: T) -> (T, T) {
    (a.clone(), a.clone())
}

// Syntactic sugar for:
//   fn add_42_millions<T: Into<i32>>(x: T) -> i32 {
fn add_42_millions(x: impl Into<i32>) -> i32 {
    x.into() + 42_000_000
}

// struct NotClonable;

fn main() {
    let foo = String::from("foo");
    let pair = duplicate(foo);
    println!("{pair:?}");

    let many = add_42_millions(42_i8);
    println!("{many}");
    let many_more = add_42_millions(10_000_000);
    println!("{many_more}");
}

Mostre uma clĂĄusula where, os estudantes irĂŁo encontrĂĄ-la quando lerem cĂłdigo.

fn duplicate<T>(a: T) -> (T, T)
where
    T: Clone,
{
    (a.clone(), a.clone())
}
  • Organiza a assinatura da função se vocĂȘ tiver muitos parĂąmetros.
  • Possui recursos adicionais tornando-o mais poderoso.
    • Se alguĂ©m perguntar, o recurso extra Ă© que o tipo Ă  esquerda de “:” pode ser arbitrĂĄrio, como Option<T>.

Trait impl

Semelhante aos limites do trait, a sintaxe do trait impl pode ser usada em argumentos de funçÔes e em valores de retorno:

use std::fmt::Display;

fn get_x(name: impl Display) -> impl Display {
    format!("OlĂĄ {name}")
}

fn main() {
    let x = get_x("foo");
    println!("{x}");
}
  • impl Trait permite que vocĂȘ trabalhe com tipos que vocĂȘ nĂŁo pode nomear.

O significado do trait impl é um pouco difere de acordo com sua posição.

  • For a parameter, impl Trait is like an anonymous generic parameter with a trait bound.

  • For a return type, it means that the return type is some concrete type that implements the trait, without naming the type. This can be useful when you don’t want to expose the concrete type in a public API.

    Inference is hard in return position. A function returning impl Foo picks the concrete type it returns, without writing it out in the source. A function returning a generic type like collect<B>() -> B can return any type satisfying B, and the caller may need to choose one, such as with let x: Vec<_> = foo.collect() or with the turbofish, foo.collect::<Vec<_>>().

Este exemplo Ă© Ăłtimo, porque usa impl Display duas vezes. Isso ajuda a explicar que nada impĂ”e que, nos dois usos, impl Display seja do mesmo tipo. Se usĂĄssemos um Ășnico T: Display, imporia a restrição de que o tipo T de entrada e o tipo T de retorno sĂŁo do mesmo tipo. Isso nĂŁo funcionaria para esta função especĂ­fica, pois o tipo que esperamos como entrada provavelmente nĂŁo Ă© o que format! retorna. Se quisĂ©ssemos fazer o mesmo atravĂ©s da sintaxe : Display, precisarĂ­amos de dois parĂąmetros genĂ©ricos independentes.

Traits Importantes

Veremos agora os Traits mais comuns da biblioteca padrĂŁo do Rust:

  • Iterator e IntoIterator usados em laços for,
  • From e Into usados na converção de valores,
  • Read e Write usados em operaçÔes de IO,
  • Add, Mul, 
 usado na sobrecarga de operadores,
  • Drop usado para definir destrutores e
  • Default usado para construir uma instĂąncia padrĂŁo para um tipo.

Iteradores

VocĂȘ pode implementar o trait Iterator em seus prĂłprios tipos:

struct Fibonacci {
    curr: u32,
    next: u32,
}

impl Iterator for Fibonacci {
    type Item = u32;

    fn next(&mut self) -> Option<Self::Item> {
        let new_next = self.curr + self.next;
        self.curr = self.next;
        self.next = new_next;
        Some(self.curr)
    }
}

fn main() {
    let fib = Fibonacci { curr: 0, next: 1 };
    for (i, n) in fib.enumerate().take(5) {
        println!("fib({i}): {n}");
    }
}
  • The Iterator trait implements many common functional programming operations over collections (e.g. map, filter, reduce, etc). This is the trait where you can find all the documentation about them. In Rust these functions should produce the code as efficient as equivalent imperative implementations.

  • IntoIterator is the trait that makes for loops work. It is implemented by collection types such as Vec<T> and references to them such as &Vec<T> and &[T]. Ranges also implement it. This is why you can iterate over a vector with for i in some_vec { .. } but some_vec.next() doesn’t exist.

FromIterator

FromIterator permite construir uma coleção a partir de um Iterator.

fn main() {
    let primes = vec![2, 3, 5, 7];
    let prime_squares = primes
        .into_iter()
        .map(|prime| prime * prime)
        .collect::<Vec<_>>();
}

Iterator implementa fn collect<B>(self) -> B where B: FromIterator<Self::Item>, Self: Sized

Também existem implementaçÔes que permitem fazer coisas legais como converter um Iterator<Item = Result<V, E>> em um Result<Vec<V>, E>.

From e Into

Os tipos implementam From e Into para facilitar as conversÔes de tipo:

fn main() {
    let s = String::from("olĂĄ");
    let addr = std::net::Ipv4Addr::from([127, 0, 0, 1]);
    let one = i16::from(true);
    let bigger = i32::from(123i16);
    println!("{s}, {addr}, {one}, {bigger}");
}

Into Ă© implementado automaticamente quando From Ă© implementado:

fn main() {
    let s: String = "olĂĄ".into();
    let addr: std::net::Ipv4Addr = [127, 0, 0, 1].into();
    let one: i16 = true.into();
    let bigger: i32 = 123i16.into();
    println!("{s}, {addr}, {one}, {bigger}");
}
  • É por isso que Ă© comum implementar apenas From, jĂĄ que seu tipo tambĂ©m receberĂĄ a implementação de Into.
  • Ao declarar um tipo de entrada de argumento de função como “qualquer coisa que possa ser convertida em String”, a regra Ă© oposta, vocĂȘ deve usar Into. Sua função aceitarĂĄ tipos que implementam From e aqueles que apenas implementam Into.

Read e Write

Usando Read e BufRead, vocĂȘ pode abstrair a leitura de conteĂșdos do tipo u8:

use std::io::{BufRead, BufReader, Read, Result};

fn count_lines<R: Read>(reader: R) -> usize {
    let buf_reader = BufReader::new(reader);
    buf_reader.lines().count()
}

fn main() -> Result<()> {
    let slice: &[u8] = b"foo\nbar\nbaz\n";
    println!("lines in slice: {}", count_lines(slice));

    let file = std::fs::File::open(std::env::current_exe()?)?;
    println!("lines in file: {}", count_lines(file));
    Ok(())
}

Da mesma forma, Write permite abstrair a escrita de dados do tipo u8:

use std::io::{Result, Write};

fn log<W: Write>(writer: &mut W, msg: &str) -> Result<()> {
    writer.write_all(msg.as_bytes())?;
    writer.write_all("\n".as_bytes())
}

fn main() -> Result<()> {
    let mut buffer = Vec::new();
    log(&mut buffer, "OlĂĄ")?;
    log(&mut buffer, "Mundo")?;
    println!("Logged: {:?}", buffer);
    Ok(())
}

O Trait Drop

Valores que implementam Drop podem especificar o cĂłdigo a ser executado quando saem do escopo:

struct Droppable {
    name: &'static str,
}

impl Drop for Droppable {
    fn drop(&mut self) {
        println!("Dropping {}", self.name);
    }
}

fn main() {
    let a = Droppable { name: "a" };
    {
        let b = Droppable { name: "b" };
        {
            let c = Droppable { name: "c" };
            let d = Droppable { name: "d" };
            println!("Exiting block B");
        }
        println!("Exiting block A");
    }
    drop(a);
    println!("Exiting main");
}

Pontos de discussĂŁo:

  • Por que Drop::drop nĂŁo recebe self?
    • Resposta curta: Se recebesse, std::mem::drop seria chamado no final do bloco, resultando em outra chamada para Drop::drop ocasionando um estouro de pilha.
  • Tente substituir drop(a) por a.drop().

O Trait Default

O trait Default fornece uma implementação padrão para um tipo.

#[derive(Debug, Default)]
struct Derived {
    x: u32,
    y: String,
    z: Implemented,
}

#[derive(Debug)]
struct Implemented(String);

impl Default for Implemented {
    fn default() -> Self {
        Self("John Smith".into())
    }
}

fn main() {
    let default_struct = Derived::default();
    println!("{default_struct:#?}");

    let almost_default_struct = Derived {
        y: "Y is set!".into(),
        ..Derived::default()
    };
    println!("{almost_default_struct:#?}");

    let nothing: Option<Derived> = None;
    println!("{:#?}", nothing.unwrap_or_default());
}
  • Ele pode ser implementado diretamente ou derivado usando #[derive(Default)].
  • A implementação usando derive produz um valor onde todos os campos sĂŁo preenchidos com seus valores padrĂŁo.
    • Consequentemente, todos os tipos usados na estrutuda devem implementar Default tambĂ©m.
  • Frequentemente, os tipos padrĂŁo do Rust implementam Default com valores razoĂĄveis (ex: 0, "", etc).
  • A cĂłpia parcial de estrututas funciona bem em conjunto com default.
  • A bilioteca padrĂŁo do Rust sabe que tipos podem implementar o trait Default e, convenientemente, provĂȘ mĂ©todos para isso.
  • the .. syntax is called struct update syntax

Add, Mul, 


A sobrecarga de operadores Ă© implementada por meio do trait contido em std::ops:

#[derive(Debug, Copy, Clone)]
struct Point { x: i32, y: i32 }

impl std::ops::Add for Point {
    type Output = Self;

    fn add(self, other: Self) -> Self {
        Self {x: self.x + other.x, y: self.y + other.y}
    }
}

fn main() {
    let p1 = Point { x: 10, y: 20 };
    let p2 = Point { x: 100, y: 200 };
    println!("{:?} + {:?} = {:?}", p1, p2, p1 + p2);
}

Pontos de discussĂŁo:

  • You could implement Add for &Point. In which situations is that useful?
    • Answer: Add:add consumes self. If type T for which you are overloading the operator is not Copy, you should consider overloading the operator for &T as well. This avoids unnecessary cloning on the call site.
  • Why is Output an associated type? Could it be made a type parameter of the method?
    • Short answer: Function type parameters are controlled by the caller, but associated types (like Output) are controlled by the implementor of a trait.
  • You could implement Add for two different types, e.g. impl Add<(i32, i32)> for Point would add a tuple to a Point.

Closures

Closures ou expressĂ”es lambda tĂȘm tipos que nĂŁo podem ser nomeados. No entanto, eles implementam os traits especiais Fn, FnMut e FnOnce:

fn apply_with_log(func: impl FnOnce(i32) -> i32, input: i32) -> i32 {
    println!("Calling function on {input}");
    func(input)
}

fn main() {
    let add_3 = |x| x + 3;
    println!("add_3: {}", apply_with_log(add_3, 10));
    println!("add_3: {}", apply_with_log(add_3, 20));

    let mut v = Vec::new();
    let mut accumulate = |x: i32| {
        v.push(x);
        v.iter().sum::<i32>()
    };
    println!("accumulate: {}", apply_with_log(&mut accumulate, 4));
    println!("accumulate: {}", apply_with_log(&mut accumulate, 5));

    let multiply_sum = |x| x * v.into_iter().sum::<i32>();
    println!("multiply_sum: {}", apply_with_log(multiply_sum, 3));
}

Um Fn nĂŁo consome nem muda os valores capturados ou talvez nĂŁo capture nada, entĂŁo, pode ser chamado vĂĄrias vezes simultaneamente.

Um FnMut pode alterar os valores capturados, entĂŁo vocĂȘ pode chamĂĄ-lo vĂĄrias vezes, mas nĂŁo simultaneamente.

Se vocĂȘ tiver um FnOnce, poderĂĄ chamĂĄ-lo apenas uma vez. Pode consumir os valores capturados.

FnMut Ă© um subtipo de FnOnce. Fn Ă© um subtipo de FnMut e FnOnce. Ou seja vocĂȘ pode usar um FnMut sempre que um FnOnce Ă© chamado e vocĂȘ pode usar um Fn sempre que um FnMut ou um FnOnce Ă© chamado.

The compiler also infers Copy (e.g. for add_3) and Clone (e.g. multiply_sum), depending on what the closure captures.

By default, closures will capture by reference if they can. The move keyword makes them capture by value.

fn make_greeter(prefix: String) -> impl Fn(&str) {
    return move |name| println!("{} {}", prefix, name)
}

fn main() {
    let hi = make_greeter("Hi".to_string());
    hi("there");
}

Dia 3: ExercĂ­cios matinais

We will design a classical GUI library using traits and trait objects.

We will also look at enum dispatch with an exercise involving points and polygons.

Depois de ver os exercĂ­cios, vocĂȘ pode ver as soluçÔes fornecidas.

Uma Biblioteca GUI Simples

Vamos projetar uma biblioteca GUI clĂĄssica usando nosso novo conhecimento de traits e objetos de trait.

Teremos vĂĄrios widgets em nossa biblioteca:

  • Window: tem um tĂ­tulo e contĂ©m outros widgets.
  • Button: tem um rĂłtulo e uma função de callback que Ă© invocada quando o botĂŁo Ă© pressionado.
  • Label: tem um rĂłtulo.

Os widgets irĂŁo implementar o trait Widget, veja abaixo.

Copie o cĂłdigo abaixo para https://play.rust-lang.org/, codifique os mĂ©todos draw_into para que vocĂȘ implemente o trait Widget:

// TODO: remova isto quando vocĂȘ terminar sua implementação .
#![allow(unused_imports, unused_variables, dead_code)]

pub trait Widget {
    /// Natural width of `self`.
    fn width(&self) -> usize;

    /// Draw the widget into a buffer.
    fn draw_into(&self, buffer: &mut dyn std::fmt::Write);

    /// Draw the widget on standard output.
    fn draw(&self) {
        let mut buffer = String::new();
        self.draw_into(&mut buffer);
        println!("{buffer}");
    }
}

pub struct Label {
    label: String,
}

impl Label {
    fn new(label: &str) -> Label {
        Label {
            label: label.to_owned(),
        }
    }
}

pub struct Button {
    label: Label,
    callback: Box<dyn FnMut()>,
}

impl Button {
    fn new(label: &str, callback: Box<dyn FnMut()>) -> Button {
        Button {
            label: Label::new(label),
            callback,
        }
    }
}

pub struct Window {
    title: String,
    widgets: Vec<Box<dyn Widget>>,
}

impl Window {
    fn new(title: &str) -> Window {
        Window {
            title: title.to_owned(),
            widgets: Vec::new(),
        }
    }

    fn add_widget(&mut self, widget: Box<dyn Widget>) {
        self.widgets.push(widget);
    }

    fn inner_width(&self) -> usize {
        std::cmp::max(
            self.title.chars().count(),
            self.widgets.iter().map(|w| w.width()).max().unwrap_or(0),
        )
    }
}


impl Widget for Label {
    fn width(&self) -> usize {
        unimplemented!()
    }

    fn draw_into(&self, buffer: &mut dyn std::fmt::Write) {
        unimplemented!()
    }
}

impl Widget for Button {
    fn width(&self) -> usize {
        unimplemented!()
    }

    fn draw_into(&self, buffer: &mut dyn std::fmt::Write) {
        unimplemented!()
    }
}

impl Widget for Window {
    fn width(&self) -> usize {
        unimplemented!()
    }

    fn draw_into(&self, buffer: &mut dyn std::fmt::Write) {
        unimplemented!()
    }
}

fn main() {
    let mut window = Window::new("Rust GUI Demo 1.23");
    window.add_widget(Box::new(Label::new("This is a small text GUI demo.")));
    window.add_widget(Box::new(Button::new(
        "Click me!",
        Box::new(|| println!("You clicked the button!")),
    )));
    window.draw();
}

A saĂ­da do programa acima pode ser algo simples como:

========
Rust GUI Demo 1.23
========

This is a small text GUI demo.

| Click me! |

Se vocĂȘ quiser desenhar texto alinhado, vocĂȘ pode usar os operadores de formatação fill/alignment. Em particular, observe como vocĂȘ pode preencher com diferentes caracteres (aqui um '/') e como vocĂȘ pode controlar o alinhamento:

fn main() {
    let width = 10;
    println!("alinhado Ă  esquerda: |{:/<width$}|", "foo");
    println!("centralizado: |{:/^width$}|", "foo");
    println!("alinhado Ă  direita: |{:/>width$}|", "foo");
}

Usando esses truques de alinhamento, vocĂȘ pode, por exemplo, produzir uma saĂ­da como esta:

+--------------------------------+
|       Rust GUI Demo 1.23       |
+================================+
| This is a small text GUI demo. |
| +-----------+                  |
| | Click me! |                  |
| +-----------+                  |
+--------------------------------+

Struct para PolĂ­gono

Vamos criar um struct Polygon que contém alguns Points. Copie o código abaixo em https://play.rust-lang.org/ e preencha os métodos que faltam para fazer os testes passarem:

// TODO: remova isto quando vocĂȘ terminar sua implementação .
#![allow(unused_variables, dead_code)]

pub struct Point {
    // adicione atributos
}

impl Point {
    // adicione métodos
}

pub struct Polygon {
    // adicione atributos
}

impl Polygon {
    // adicione métodos
}

pub struct Circle {
    // adicione atributos
}

impl Circle {
    // adicione métodos
}

pub enum Shape {
    Polygon(Polygon),
    Circle(Circle),
}

#[cfg(test)]
mod tests {
    use super::*;

    fn round_two_digits(x: f64) -> f64 {
        (x * 100.0).round() / 100.0
    }

    #[test]
    fn test_point_magnitude() {
        let p1 = Point::new(12, 13);
        assert_eq!(round_two_digits(p1.magnitude()), 17.69);
    }

    #[test]
    fn test_point_dist() {
        let p1 = Point::new(10, 10);
        let p2 = Point::new(14, 13);
        assert_eq!(round_two_digits(p1.dist(p2)), 5.00);
    }

    #[test]
    fn test_point_add() {
        let p1 = Point::new(16, 16);
        let p2 = p1 + Point::new(-4, 3);
        assert_eq!(p2, Point::new(12, 19));
    }

    #[test]
    fn test_polygon_left_most_point() {
        let p1 = Point::new(12, 13);
        let p2 = Point::new(16, 16);

        let mut poly = Polygon::new();
        poly.add_point(p1);
        poly.add_point(p2);
        assert_eq!(poly.left_most_point(), Some(p1));
    }

    #[test]
    fn test_polygon_iter() {
        let p1 = Point::new(12, 13);
        let p2 = Point::new(16, 16);

        let mut poly = Polygon::new();
        poly.add_point(p1);
        poly.add_point(p2);

        let points = poly.iter().cloned().collect::<Vec<_>>();
        assert_eq!(points, vec![Point::new(12, 13), Point::new(16, 16)]);
    }

    #[test]
    fn test_shape_perimeters() {
        let mut poly = Polygon::new();
        poly.add_point(Point::new(12, 13));
        poly.add_point(Point::new(17, 11));
        poly.add_point(Point::new(16, 16));
        let shapes = vec![
            Shape::from(poly),
            Shape::from(Circle::new(Point::new(10, 20), 5)),
        ];
        let perimeters = shapes
            .iter()
            .map(Shape::perimeter)
            .map(round_two_digits)
            .collect::<Vec<_>>();
        assert_eq!(perimeters, vec![15.48, 31.42]);
    }
}

#[allow(dead_code)]
fn main() {}

Como as assinaturas dos métodos estão faltando nas declaraçÔes do problema, a parte principal do exercício é especificå-las corretamente. Não é preciso modificar os testes.

Outras partes interessante do exercĂ­cio:

  • Derive um trait Copy para algumas structs, jĂĄ que em testes os mĂ©todos Ă s vezes nĂŁo emprestam seus argumentos.
  • Descubra que o trait Add deve ser implementado para que dois objetos sejam adicionados via “+”. Note que nĂłs nĂŁo discutimos generics atĂ© o Dia 3.

Tratamento de Erros

O tratamento de erros em Rust Ă© feito usando fluxo de controle explĂ­cito:

  • FunçÔes que podem ter erros mostram isso em seu tipo de retorno.
  • NĂŁo hĂĄ exceçÔes (exceptions).

Panics (PĂąnico)

O Rust irå disparar um panic (pùnico) se um erro fatal ocorrer em tempo de execução:

fn main() {
    let v = vec![10, 20, 30];
    println!("v[100]: {}", v[100]);
}
  • PĂąnicos sĂŁo para erros irrecuperĂĄveis e inesperados.
    • PĂąnicos sĂŁo sintomas de bugs no programa.
  • Use APIs que nĂŁo disparam erros do tipo pĂąnico (como Vec::get) se nĂŁo for aceitĂĄvel o travamento do programa.

Capturando a Resolução da Pilha (Stack Unwinding)

Por padrão, um pùnico causarå a resolução da pilha. A resolução pode ser capturada:

use std::panic;

fn main() {
    let result = panic::catch_unwind(|| {
        println!("olĂĄ!");
    });
    assert!(result.is_ok());
    
    let result = panic::catch_unwind(|| {
        panic!("ah nĂŁo!");
    });
    assert!(result.is_err());
}
  • Isso pode ser Ăștil em servidores que devem continuar rodando mesmo se uma requisição tenha falhado.
  • Isso nĂŁo funciona se panic = 'abort' estiver definido em seu Cargo.toml.

Tratamento Estruturado de Erros com Result

Jå vimos o enum Result. Ele é usado amplamente quando os erros são esperados como parte da operação normal:

use std::fs;
use std::io::Read;

fn main() {
    let file = fs::File::open("diario.txt");
    match file {
        Ok(mut file) => {
            let mut contents = String::new();
            file.read_to_string(&mut contents);
            println!("Querido diĂĄrio: {contents}");
        },
        Err(err) => {
            println!("NĂŁo foi possĂ­vel abrir o diĂĄrio: {err}");
        }
    }
}
  • Como em Option, o valor bem-sucedido fica dentro de Result, forçando o desenvolvedor a extraĂ­-lo explicitamente. Isso encoraja a verificação de erros. No caso em que um erro nunca deve acontecer, unwrap() ou expect() podem ser chamados, e isso tambĂ©m sinaliza a intenção do desenvolvedor.
  • A documentação de Result Ă© uma leitura recomendada. NĂŁo durante o curso, mas vale a pena mencionĂĄ-la. Ele contĂ©m muitos mĂ©todos e funçÔes de conveniĂȘncia que ajudam na programação ao estilo funcional.

Propagando Erros com ?

O operador try ? é usado para retornar erros ao chamador da função. Se ocorrer um erro, este é retornado imediatamente ao chamador como retorno da função.

match some_expression {
    Ok(value) => value,
    Err(err) => return Err(err),
}

O cĂłdigo acima pode ser simplificado para:

some_expression?

Podemos usar isso para simplificar nosso cĂłdigo de tratamento de erros:

use std::{fs, io};
use std::io::Read;

fn read_username(path: &str) -> Result<String, io::Error> {
    let username_file_result = fs::File::open(path);
    let mut username_file = match username_file_result {
        Ok(file) => file,
        Err(err) => return Err(err),
    };

    let mut username = String::new();
    match username_file.read_to_string(&mut username) {
        Ok(_) => Ok(username),
        Err(err) => Err(err),
    }
}

fn main() {
    //fs::write("config.dat", "alice").unwrap();
    let username = read_username("config.dat");
    println!("nome_usuario ou erro: {username:?}");
}

Pontos chave:

  • A variĂĄvel nome_usuario pode ser Ok(string) ou Err(error).
  • Use a chamada fs::write para testar os diferentes cenĂĄrios: nenhum arquivo, arquivo vazio e arquivo com nome de usuĂĄrio.
  • The return type of the function has to be compatible with the nested functions it calls. For instance, a function returning a Result<T, Err> can only apply the ? operator on a function returning a Result<AnyT, Err>. It cannot apply the ? operator on a function returning an Option<AnyT> or Result<T, OtherErr> unless OtherErr implements From<Err>. Reciprocally, a function returning an Option<T> can only apply the ? operator on a function returning an Option<AnyT>.
    • You can convert incompatible types into one another with the different Option and Result methods such as Option::ok_or, Result::ok, Result::err.

Convertendo Tipos de Erro

A expansĂŁo efetiva do operador ? Ă© um pouco mais complicada do que indicado anteriormente:

expression?

funciona da mesma forma que

match expression {
    Ok(value) => value,
    Err(err)  => return Err(From::from(err)),
}

A chamada From::from aqui significa que tentamos converter o tipo de erro para o tipo retornado pela função:

Convertendo Tipos de Erro

use std::error::Error;
use std::fmt::{self, Display, Formatter};
use std::fs::{self, File};
use std::io::{self, Read};

#[derive(Debug)]
enum ReadUsernameError {
    IoError(io::Error),
    EmptyUsername(String),
}

impl Error for ReadUsernameError {}

impl Display for ReadUsernameError {
    fn fmt(&self, f: &mut Formatter) -> fmt::Result {
        match self {
            Self::IoError(e) => write!(f, "Erro E/S: {e}"),
            Self::EmptyUsername(filename) => write!(f, "Nome de usuĂĄrio nĂŁo encontrado em {filename}"),
        }
    }
}

impl From<io::Error> for ReadUsernameError {
    fn from(err: io::Error) -> ReadUsernameError {
        ReadUsernameError::IoError(err)
    }
}

fn read_username(path: &str) -> Result<String, ReadUsernameError> {
    let mut username = String::with_capacity(100);
    File::open(path)?.read_to_string(&mut username)?;
    if username.is_empty() {
        return Err(ReadUsernameError::EmptyUsername(String::from(path)));
    }
    Ok(username)
}

fn main() {
    //fs::write("config.dat", "").unwrap();
    let username = read_username("config.dat");
    println!("nome_usuario ou erro: {username:?}");
}

Pontos chave:

  • A variĂĄvel nome_usuario pode ser Ok(string) ou Err(error).
  • Use a chamada fs::write para testar os diferentes cenĂĄrios: nenhum arquivo, arquivo vazio e arquivo com nome de usuĂĄrio.

É uma boa prĂĄtica para todos os tipos de erro que nĂŁo precisam ser no_std implementar std::error::Error, que requer Debug e Display. O crate Error para core sĂł estĂĄ disponĂ­vel em nightly, entĂŁo ainda nĂŁo Ă© totalmente compatĂ­vel com no_std.

Geralmente Ă© Ăștil para eles implementar Clone e Eq tambĂ©m quando possĂ­vel, para tornar mais fĂĄcil a vida para testes e consumidores da sua biblioteca. Neste caso, nĂŁo podemos fazĂȘ-lo facilmente, porque io::Error nĂŁo os implementa.

Derivando Enums de Erro

O crate thiserror Ă© uma maneira popular de criar um tipo enumerado (enum) de erro, como fizemos na pĂĄgina anterior:

use std::{fs, io};
use std::io::Read;
use thiserror::Error;

#[derive(Debug, Error)]
enum ReadUsernameError {
    #[error("NĂŁo Ă© possivel ler: {0}")]
    IoError(#[from] io::Error),
    #[error("Nome de usuĂĄrio nĂŁo encontrado em {0}")]
    EmptyUsername(String),
}

fn read_username(path: &str) -> Result<String, ReadUsernameError> {
    let mut username = String::new();
    fs::File::open(path)?.read_to_string(&mut username)?;
    if username.is_empty() {
        return Err(ReadUsernameError::EmptyUsername(String::from(path)));
    }
    Ok(username)
}

fn main() {
    //fs::write("config.dat", "").unwrap();
    match read_username("config.dat") {
        Ok(username) => println!("Nome do usuĂĄrio: {nome_usuario}"),
        Err(err)     => println!("Erro: {err}"),
    }
}

A derive macro thiserror implementa automaticamente std::error::Error, e opcionalmente, Display (se os atributos #[error(...)] forem fornecidos) e From (se o atributo #[from] for adicionado). Também funciona para structs.

NĂŁo afeta sua API pĂșblica, o que a torna boa para bibliotecas.

Tipos de Erros DinĂąmicos

Às vezes, queremos permitir que qualquer tipo de erro seja retornado sem escrever nosso próprio Enum abrangendo todas as diferentes possibilidades. std::error::Error torna isso fácil.

use std::fs;
use std::io::Read;
use thiserror::Error;
use std::error::Error;

#[derive(Clone, Debug, Eq, Error, PartialEq)]
#[error("Nome de usuĂĄrio nĂŁo encontrado em {0}")]
struct EmptyUsernameError(String);

fn read_username(path: &str) -> Result<String, Box<dyn Error>> {
    let mut username = String::new();
    fs::File::open(path)?.read_to_string(&mut username)?;
    if username.is_empty() {
        return Err(EmptyUsernameError(String::from(path)).into());
    }
    Ok(username)
}

fn main() {
    //fs::write("config.dat", "").unwrap();
    match read_username("config.dat") {
        Ok(username) => println!("Nome do usuĂĄrio: {nome_usuario}"),
        Err(err)     => println!("Erro: {err}"),
    }
}

Isso economiza cĂłdigo, mas abre mĂŁo da capacidade de lidar com diferentes casos de erro de maneira diferenciada no programa. Como tal, geralmente nĂŁo Ă© uma boa ideia usar Box<dyn Error> na API pĂșblica de uma biblioteca, mas pode ser uma boa opção em um programa onde vocĂȘ deseja apenas exibir a mensagem de erro em algum lugar.

Adicionando Contexto aos Erros

O crate anyhow Ă© amplamente usado e pode lhe ajudar a adicionar informaçÔes contextuais aos seus erros, permitindo que vocĂȘ tenha menos tipos de erros personalizados:

use std::{fs, io};
use std::io::Read;
use anyhow::{Context, Result, bail};

fn read_username(path: &str) -> Result<String> {
    let mut username = String::with_capacity(100);
    fs::File::open(path)
        .with_context(|| format!("Falha ao abrir {caminho}"))?
        .read_to_string(&mut username)
        .context("Falha ao ler")?;
    if username.is_empty() {
        bail!("Nome de usuĂĄrio nĂŁo encontrado em {path}");
    }
    Ok(username)
}

fn main() {
    //fs::write("config.dat", "").unwrap();
    match read_username("config.dat") {
        Ok(username) => println!("Nome do usuĂĄrio: {nome_usuario}"),
        Err(err)     => println!("Erro: {err:?}"),
    }
}
  • anyhow::Result<V> Ă© um apelido de tipo para Result<V, anyhow::Error>.
  • anyhow::Error Ă© essencialmente um wrapper em torno de Box<dyn Error>. Como tal, geralmente nĂŁo Ă© uma boa escolha para a API pĂșblica de uma biblioteca, mas Ă© amplamente utilizado em aplicaçÔes.
  • O tipo de erro real dentro dele pode ser extraĂ­do para exame, se necessĂĄrio.
  • A funcionalidade fornecida por anyhow::Result<T> pode ser familiar para desenvolvedores Go, pois fornece padrĂ”es de uso e ergonomia semelhantes a (T, error) de Go.

Testando

Rust e Cargo vĂȘm com uma estrutura de testes unitĂĄrios simples:

  • Testes unitĂĄrios sĂŁo suportados em todo o seu cĂłdigo.

  • Testes de integração sĂŁo suportados atravĂ©s do diretĂłrio tests/.

Testes UnitĂĄrios

Marque os testes unitĂĄrios com #[test]:

fn first_word(text: &str) -> &str {
    match text.find(' ') {
        Some(idx) => &text[..idx],
        None => &text,
    }
}

#[test]
fn test_empty() {
    assert_eq!(first_word(""), "");
}

#[test]
fn test_single_word() {
    assert_eq!(first_word("OlĂĄ"), "OlĂĄ");
}

#[test]
fn test_multiple_words() {
    assert_eq!(first_word("Hello World"), "OlĂĄ");
}

Use cargo test para encontrar e executar os testes unitĂĄrios.

MĂłdulos de Teste

Testes unitĂĄrios geralmente sĂŁo colocados em um mĂłdulo aninhado (execute testes no Playground):

fn helper(a: &str, b: &str) -> String {
    format!("{a} {b}")
}

pub fn main() {
    println!("{}", helper("OlĂĄ", "Mundo"));
}

#[cfg(test)]
mod tests {
    use super::*;

    #[test]
    fn test_helper() {
        assert_eq!(helper("foo", "bar"), "foo bar");
    }
}
  • Isso permite que vocĂȘ tenha testes unitĂĄrios auxiliares privados.
  • O atributo #[cfg(test)] somente fica ativo quando vocĂȘ executa cargo test.

Testes de Documentação

Rust tem suporte embutido para testes de documentação:

#![allow(unused)]
fn main() {
/// Encurta uma string para o comprimento especificado.
///
/// ```
/// use playground::encurtar_string;
/// assert_eq!(encurtar_string("OlĂĄ Mundo", 4), "OlĂĄ");
/// assert_eq!(encurtar_string("OlĂĄ Mundo", 20), "OlĂĄ Mundo");
/// ```
pub fn shorten_string(s: &str, length: usize) -> &str {
    &s[..std::cmp::min(length, s.len())]
}
}
  • Blocos de cĂłdigo em comentĂĄrios /// sĂŁo vistos automaticamente como cĂłdigo Rust.
  • O cĂłdigo serĂĄ compilado e executado como parte do cargo test.
  • Teste o cĂłdigo acima no Rust Playground.

Testes de Integração

Se quiser testar sua biblioteca como um cliente, use um teste de integração.

Crie um arquivo .rs em tests/:

use my_library::init;

#[test]
fn test_init() {
    assert!(init().is_ok());
}

Esses testes tĂȘm acesso somente Ă  API pĂșblica do seu crate.

Crates Úteis para Escrever Testes

Rust possui apenas suporte bĂĄsico para escrever testes.

Estes sĂŁo alguns crates adicionais que recomendamos para a escrita de testes:

  • googletest: Biblioteca abrangente para testes de assertividade na tradição de GoogleTest para C++.
  • proptest: Testes baseados em propriedades para Rust.
  • rstest: Suporte para testes parametrizados e acessĂłrios.

Rust Inseguro (unsafe)

A linguagem Rust tem duas partes:

  • Rust Seguro (Safe): memĂłria segura, nenhum comportamento indefinido Ă© possĂ­vel.
  • Rust Inseguro (Unsafe): pode desencadear comportamento indefinido se prĂ©-condiçÔes forem violadas.

Veremos principalmente Rust seguro neste curso, mas Ă© importante saber o que Ă© Rust inseguro (unsafe).

Código inseguro é geralmente pequeno e isolado, e seu funcionamento correto deve ser cuidadosamente documentado. Geralmente é envolto em uma camada de abstração segura.

O cĂłdigo inseguro do Rust oferece acesso a cinco novos recursos:

  • Desreferenciar ponteiros brutos.
  • Acessar ou modificar variĂĄveis estĂĄticas mutĂĄveis.
  • Acessar os campos de uma union.
  • Chamar funçÔes inseguras (unsafe), incluindo funçÔes extern (externas).
  • Implementar traits inseguros (unsafe traits).

A seguir, abordaremos brevemente os recursos inseguros. Para detalhes completos, consulte o CapĂ­tulo 19.1 no Rust Book e o Rustonomicon.

Rust inseguro não significa que o código esteja incorreto. Significa que os desenvolvedores desligaram os recursos de segurança do compilador e precisam escrever o código corretamente por eles mesmos. Significa também que o compilador não impÔe mais as regras de segurança de memória do Rust.

Desreferenciando Ponteiros Brutos

Criar ponteiros Ă© seguro, mas desreferenciĂĄ-los requer unsafe:

fn main() {
    let mut num = 5;

    let r1 = &mut num as *mut i32;
    let r2 = r1 as *const i32;

    // Seguro porque r1 e r2 foram obtidos atravĂ©s de referĂȘncias e logo Ă©
    // garantido que eles nĂŁo sejam nulos e sejam propriamente alinhados, os objetos
    // cujas referĂȘncias foram obtidas sĂŁo vĂĄlidos por
    // todo o bloco inseguro, e eles não sejam acessados tanto através das
    // referĂȘncias ou concorrentemente atravĂ©s de outros ponteiros.
    unsafe {
        println!("r1 Ă©: {}", *r1);
        *r1 = 10;
        println!("r2 Ă©: {}", *r2);
    }
}

É uma boa prática (e exigida pelo guia de estilo do Android Rust) escrever um comentário para cada bloco unsafe explicando como o código dentro dele satisfaz os requisitos de segurança para a operação insegura que está fazendo.

No caso de desreferĂȘncia de ponteiros, isso significa que os ponteiros devem ser vĂĄlidos, ou seja:

  • O ponteiro deve ser nĂŁo nulo.
  • O ponteiro deve ser desreferenciĂĄvel (dentro dos limites de um Ășnico objeto alocado).
  • O objeto nĂŁo deve ter sido desalocado.
  • NĂŁo deve haver acessos simultĂąneos Ă  mesma localização.
  • Se o ponteiro foi obtido lançando uma referĂȘncia, o objeto subjacente deve estar vĂĄlido e nenhuma referĂȘncia pode ser usada para acessar a memĂłria.

Na maioria dos casos, o ponteiro também deve estar alinhado corretamente.

VariĂĄveis EstĂĄticas MutĂĄveis

É seguro ler uma variável estática imutável:

static HELLO_WORLD: &str = "OlĂĄ, mundo!";

fn main() {
    println!("HELLO_WORLD: {HELLO_WORLD}");
}

No entanto, como podem ocorrer corridas de dados, nĂŁo Ă© seguro ler e gravar dados em variĂĄveis estĂĄticas mutĂĄveis:

static mut COUNTER: u32 = 0;

fn add_to_counter(inc: u32) {
    unsafe { COUNTER += inc; }  // Corrida de dados potencial!
}

fn main() {
    add_to_counter(42);

    unsafe { println!("COUNTER: {COUNTER}"); }  // Corrida de dados potencial!
}

Usar uma variĂĄvel estĂĄtica mutĂĄvel geralmente Ă© uma mĂĄ ideia, mas hĂĄ alguns casos em que isso pode fazer sentido, tais como em cĂłdigo no_std de baixo nĂ­vel, como implementar um alocador de heap ou trabalhar com algumas APIs C.

UniÔes

Unions sĂŁo como enums, mas vocĂȘ mesmo precisa rastrear o campo ativo:

#[repr(C)]
union MyUnion {
    i: u8,
    b: bool,
}

fn main() {
    let u = MyUnion { i: 42 };
    println!("int: {}", unsafe { u.i });
    println!("bool: {}", unsafe { u.b });  // Comportamento indefinido!
}

Unions raramente sĂŁo necessĂĄrias no Rust, pois geralmente vocĂȘ pode usar um enum. Elas sĂŁo ocasionalmente necessĂĄrias para interagir com as APIs da biblioteca C.

Se vocĂȘ deseja apenas reinterpretar os bytes como um tipo diferente, vocĂȘ provavelmente deveria usar std::mem::transmute ou um wrapper seguro como o crate zerocopy.

Chamando FunçÔes Inseguras

Uma função ou mĂ©todo pode ser marcado como unsafe se houver prĂ©-condiçÔes extras que vocĂȘ deve respeitar para evitar comportamento indefinido:

fn main() {
    let emojis = "đŸ—»âˆˆđŸŒ";

    // Seguro porque os Ă­ndices estĂŁo na ordem correta, dentro dos limites da
    // slice da string, e contido dentro da sequĂȘncia UTF-8.
    unsafe {
        println!("emoji: {}", emojis.get_unchecked(0..4));
        println!("emoji: {}", emojis.get_unchecked(4..7));
        println!("emoji: {}", emojis.get_unchecked(7..11));
    }

    println!("contador de caracteres: {}", count_chars(unsafe { emojis.get_unchecked(0..7) }));

    // Não manter o requerimento de codificação UTF-8 viola segurança de memória!
    // println!("emoji: {}", unsafe { emojis.get_unchecked(0..3) });
    // println!("contador caracter: {}", contador_caracteres(unsafe { emojis.get_unchecked(0..3) }));
}

fn count_chars(s: &str) -> usize {
    s.chars().map(|_| 1).sum()
}

Escrevendo FunçÔes Inseguras

VocĂȘ pode marcar suas prĂłprias funçÔes como inseguras (unsafe) se elas exigirem condiçÔes especĂ­ficas para evitar comportamentos indefinidos.

/// Troca os valores apontadoes pelos ponteiros fornecidos.
///
/// # Segurança
///
/// Os ponteiros precisam ser vĂĄlidos e corretamente alinhados.
unsafe fn swap(a: *mut u8, b: *mut u8) {
    let temp = *a;
    *a = *b;
    *b = temp;
}

fn main() {
    let mut a = 42;
    let mut b = 66;

    // Seguro porque ...
    unsafe {
        swap(&mut a, &mut b);
    }

    println!("a = {}, b = {}", a, b);
}

Na verdade, nĂŁo usarĂ­amos ponteiros para essa operação porque isso pode ser feito com segurança usando referĂȘncias.

Observe que o código inseguro é permitido dentro de uma função insegura sem o uso de um bloco unsafe. Podemos proibir isso com #[deny(unsafe_op_in_unsafe_fn)]. Tente adicionå-lo e veja o que acontece.

Chamando CĂłdigo Externo

FunçÔes de outras linguagens podem violar as garantias do Rust. Logo, chamå-las é inseguro:

extern "C" {
    fn abs(input: i32) -> i32;
}

fn main() {
    unsafe {
        // Comportamento indefinido se abs se comportar mal.
        println!("Valor absoluto de -3 de acordo com C: {}", abs(-3));
    }
}

Normalmente isso é apenas um problema para funçÔes externas que fazem coisas com ponteiros que podem violar o modelo de memória do Rust, mas em geral qualquer função C pode ter comportamento indefinido sob quaisquer circunstùncias arbitrårias.

O "C" neste exemplo é o ABI; outros ABIs também estão disponíveis.

Implementando Traits Inseguros

Assim como nas funçÔes, vocĂȘ pode marcar um trait como unsafe se a implementação precisa garantir condiçÔes particulares para evitar comportamento indefinido.

Por exemplo, o crate zerocopy tem um trait inseguro que parece algo assim:

use std::mem::size_of_val;
use std::slice;

/// ...
/// # Segurança
/// O tipo precisa ter uma representação definida e nenhum preenchimento.
pub unsafe trait AsBytes {
    fn as_bytes(&self) -> &[u8] {
        unsafe {
            slice::from_raw_parts(self as *const Self as *const u8, size_of_val(self))
        }
    }
}

// Seguro porque u32 possui uma representação definida e sem preenchimento.
unsafe impl AsBytes for u32 {}

Deve haver uma seção # Safety no Rustdoc para o trait explicando os requisitos para ser implementado com segurança.

Na verdade, a seção de segurança para AsBytes é bem mais longa e complicada.

Os traits integrados Send e Sync sĂŁo inseguros.

Dia 3: ExercĂ­cios da Tarde

Vamos construir um wrapper seguro para ler o conteĂșdo do diretĂłrio!

Para este exercício, nós sugerimos a utilizaçao de um ambiente de desenvolvimento local ao invés do Playground. Isto lhe permitirå executar o binårio na sua própria måquina.

Para começar, siga as instruçoes para rodar localmente.

Depois de ver o exercĂ­cio, vocĂȘ pode ver a solução fornecida.

Wrapper FFI seguro

Rust tem Ăłtimo suporte para chamar funçÔes por meio de uma interface para funçÔes externas (Function Foreign Interface - FFI). Usaremos isso para construir um wrapper (invĂłlucro) seguro para as funçÔes da libc de C que vocĂȘ usaria para ler os nomes dos arquivos de um diretĂłrio.

VocĂȘ vai querer consultar as pĂĄginas do manual:

VocĂȘ tambĂ©m vai querer navegar pelo mĂłdulo std::ffi. LĂĄ vocĂȘ encontrarĂĄ um nĂșmero de tipos de string que vocĂȘ precisarĂĄ para o exercĂ­cio:

TiposCodificaçãoUso
str e StringUTF-8Processamento de texto em Rust
CStr e CStringterminado em NULComunicação com funçÔes em C
OsStr e OsStringespecífico ao SOComunicação com o SO

VocĂȘ irĂĄ converter entre todos estes tipos:

  • &str para CString: vocĂȘ precisa alocar espaço para o caracter terminador \0,
  • CString para *const i8: vocĂȘ precisa de um ponteiro para chamar funçÔes em C,
  • *const i8 para &CStr: vocĂȘ vocĂȘ precisa de algo que pode encontrar o caracter terminador \0,
  • &CStr para &[u8]: um slice de bytes Ă© a interface universal para “algum dado desconhecido”,
  • &[u8] para &OsStr: &OsStr Ă© um passo em direção a OsString, use OsStrExt para criĂĄ-lo,
  • &OsStr para OsString: vocĂȘ precisa clonar os dados em &OsStr para poder retornĂĄ-lo e chamar readdir novamente.

O Nomicon tambĂ©m tem um capĂ­tulo bastante Ăștil sobre FFI.

Copie o código abaixo para https://play.rust-lang.org/ e implemente as funçÔes e métodos que faltam:

// TODO: remova isto quando vocĂȘ terminar sua implementação .
#![allow(unused_imports, unused_variables, dead_code)]

mod ffi {
    use std::os::raw::{c_char, c_int};
    #[cfg(not(target_os = "macos"))]
    use std::os::raw::{c_long, c_ulong, c_ushort, c_uchar};

    // Tipo opaco. Veja https://doc.rust-lang.org/nomicon/ffi.html.
    #[repr(C)]
    pub struct DIR {
        _data: [u8; 0],
        _marker: core::marker::PhantomData<(*mut u8, core::marker::PhantomPinned)>,
    }

    // Layout de acordo com a pĂĄgina man do Linux para readdir(3), onde ino_t e
    // off_t são resolvidos de acordo com as definiçÔes em
    // /usr/include/x86_64-linux-gnu/{sys/types.h, bits/typesizes.h}.
    #[cfg(not(target_os = "macos"))]
    #[repr(C)]
    pub struct dirent {
        pub d_ino: c_ulong,
        pub d_off: c_long,
        pub d_reclen: c_ushort,
        pub d_type: c_uchar,
        pub d_name: [c_char; 256],
    }

    // Layout de acordo com a pĂĄgina man do macOS man page para dir(5).
    #[cfg(all(target_os = "macos"))]
    #[repr(C)]
    pub struct dirent {
        pub d_fileno: u64,
        pub d_seekoff: u64,
        pub d_reclen: u16,
        pub d_namlen: u16,
        pub d_type: u8,
        pub d_name: [c_char; 1024],
    }

    extern "C" {
        pub fn opendir(s: *const c_char) -> *mut DIR;

        #[cfg(not(all(target_os = "macos", target_arch = "x86_64")))]
        pub fn readdir(s: *mut DIR) -> *const dirent;

        // Veja https://github.com/rust-lang/libc/issues/414 e a seção sobre
        // _DARWIN_FEATURE_64_BIT_INODE na pĂĄgina man do macOS para stat(2).
        //
        // "Plataformas que existiram antes destas atualizaçÔes estarem disponíveis" refere-se
        // ao macOS (ao contrĂĄrio do iOS / wearOS / etc.) em Intel e PowerPC.
        #[cfg(all(target_os = "macos", target_arch = "x86_64"))]
        #[link_name = "readdir$INODE64"]
        pub fn readdir(s: *mut DIR) -> *const dirent;

        pub fn closedir(s: *mut DIR) -> c_int;
    }
}

use std::ffi::{CStr, CString, OsStr, OsString};
use std::os::unix::ffi::OsStrExt;

#[derive(Debug)]
struct DirectoryIterator {
    path: CString,
    dir: *mut ffi::DIR,
}

impl DirectoryIterator {
    fn new(path: &str) -> Result<DirectoryIterator, String> {
        // Chama opendir e retorna um valor Ok se funcionar,
        // ou retorna Err com uma mensagem.
        unimplemented!()
    }
}

impl Iterator for DirectoryIterator {
    type Item = OsString;
    fn next(&mut self) -> Option<OsString> {
        // Continua chamando readdir até nós obtermos um ponteiro NULL de volta.
        unimplemented!()
    }
}

impl Drop for DirectoryIterator {
    fn drop(&mut self) {
        // Chama closedir se necessĂĄrio.
        unimplemented!()
    }
}

fn main() -> Result<(), String> {
    let iter = DirectoryIterator::new(".")?;
    println!("files: {:#?}", iter.collect::<Vec<_>>());
    Ok(())
}

Bem-vindo ao Rust para Android

Rust tem suporte para desenvolvimento de plataforma nativa no Android. Isso significa que vocĂȘ pode escrever novos serviços de sistema operacional em Rust, bem como estender serviços existentes.

Hoje tentaremos chamar Rust a partir de um de seus prĂłprios projetos. EntĂŁo tente encontrar um cantinho da sua base de cĂłdigo onde podemos mover algumas linhas de cĂłdigo para o Rust. Quanto menos dependĂȘncias e tipos “exĂłticos”, melhor. Algo que analise alguns bytes brutos seria o ideal.

Configurar

Iremos usar o um dispositivo virtual Android para testar nosso cĂłdigo. Assegure-se de ter acesso a um ou crie um novo com:

source build/envsetup.sh
lunch aosp_cf_x86_64_phone-userdebug
acloud create

Consulte o Codelab para Desenvolvedor Android para maiores detalhes.

Regras de Construção (Build)

O sistema de compilação do Android (Soong) oferece suporte ao Rust por meio de vårios módulos:

Tipo de móduloDescrição
rust_binaryProduz um binĂĄrio Rust.
rust_libraryProduz uma biblioteca Rust e fornece as variantes rlib e dylib.
rust_ffiProduz uma biblioteca Rust C utilizĂĄvel por mĂłdulos cc e fornece variantes estĂĄticas e compartilhadas.
rust_proc_macroProduz uma biblioteca Rust proc-macro. Estes sĂŁo anĂĄlogos aos plugins do compilador.
rust_testProduz um binĂĄrio de teste Rust que usa a funcionalidade padrĂŁo de teste do Rust.
rust_fuzzProduz um binĂĄrio Rust fuzz aproveitando libfuzzer.
rust_protobufGera o cĂłdigo-fonte e produz uma biblioteca Rust que fornece uma interface para um protobuf especĂ­fico.
rust_bindgenGera fonte e produz uma biblioteca Rust contendo vĂ­nculos em Rust para bibliotecas C.

Veremos rust_binary e rust_library a seguir.

BinĂĄrios do Rust

Vamos começar com um aplicativo simples. Na raiz de um checkout AOSP, crie os seguintes arquivos:

hello_rust/Android.bp:

rust_binary {
    name: "hello_rust",
    crate_name: "hello_rust",
    srcs: ["src/main.rs"],
}

hello_rust/src/main.rs:

//! Rust demo.

/// Imprime uma saudação na saída padrão.
fn main() {
    println!("OlĂĄ do Rust!");
}

Agora vocĂȘ pode compilar, enviar e executar o binĂĄrio:

m hello_rust
adb push "$ANDROID_PRODUCT_OUT/system/bin/hello_rust /data/local/tmp"
adb shell /data/local/tmp/hello_rust
Hello from Rust!

Bibliotecas de Rust

VocĂȘ usa rust_library para criar uma nova biblioteca Rust para Android.

Aqui declaramos uma dependĂȘncia em duas bibliotecas:

  • libgreeting, que definimos abaixo,
  • libtextwrap, que Ă© um crate jĂĄ oferecido em external/rust/crates/.

hello_rust/Android.bp:

rust_binary {
    name: "hello_rust_with_dep",
    crate_name: "hello_rust_with_dep",
    srcs: ["src/main.rs"],
    rustlibs: [
        "libgreetings",
        "libtextwrap",
    ],
    prefer_rlib: true,
}

rust_library {
    name: "libgreetings",
    crate_name: "greetings",
    srcs: ["src/lib.rs"],
}

hello_rust/src/main.rs:

//! Rust demo.

use greetings::greeting;
use textwrap::fill;

/// Imprime uma saudação na saída padrão.
fn main() {
    println!("{}", fill(&greeting("Bob"), 24));
}

hello_rust/src/lib.rs:

//! Greeting library.

/// Saudação `nome`.
pub fn greeting(name: &str) -> String {
    format!("OlĂĄ {nome}, prazer em conhecĂȘ-lo!")
}

VocĂȘ constrĂłi, envia e executa o binĂĄrio como antes:

m hello_rust_with_dep
adb push "$ANDROID_PRODUCT_OUT/system/bin/hello_rust_with_dep /data/local/tmp"
adb shell /data/local/tmp/hello_rust_with_dep
Hello Bob, it is very
nice to meet you!

AIDL

A Linguagem de Definição de Interface Android (AIDL) é compatível com Rust:

  • O cĂłdigo Rust pode chamar servidores AIDL existentes,
  • VocĂȘ pode criar novos servidores AIDL em Rust.

Interfaces AIDL

VocĂȘ declara a API do seu serviço usando uma interface AIDL:

birthday_service/aidl/com/example/birthdayservice/IBirthdayService.aidl:

package com.example.birthdayservice;

/** Interface de serviço de aniversårio. */
interface IBirthdayService {
    /** Gera uma mensagem de feliz aniversĂĄrio. */
    String wishHappyBirthday(String name, int years);
}

birthday_service/aidl/Android.bp:

aidl_interface {
    name: "com.example.birthdayservice",
    srcs: ["com/example/birthdayservice/*.aidl"],
    unstable: true,
    backend: {
        rust: { // Rust nĂŁo estĂĄ ativado por padrĂŁo
            enabled: true,
        },
    },
}

Adicione vendor_available: true caso seu arquivo AIDL seja usado por um binårio na partição vendor.

Implementação do Serviço

Agora podemos implementar o serviço AIDL:

birthday_service/src/lib.rs:

//! Implementation of the `IBirthdayService` AIDL interface.
use com_example_birthdayservice::aidl::com::example::birthdayservice::IBirthdayService::IBirthdayService;
use com_example_birthdayservice::binder;

/// A implementação de `IBirthdayService`.
pub struct BirthdayService;

impl binder::Interface for BirthdayService {}

impl IBirthdayService for BirthdayService {
    fn wishHappyBirthday(&self, name: &str, years: i32) -> binder::Result<String> {
        Ok(format!(
            "Feliz aniversårio {name}, parabéns pelos seus {years} anos!"
        ))
    }
}

birthday_service/Android.bp:

rust_library {
    name: "libbirthdayservice",
    srcs: ["src/lib.rs"],
    crate_name: "birthdayservice",
    rustlibs: [
        "com.example.birthdayservice-rust",
        "libbinder_rs",
    ],
}

Servidor AIDL

Finalmente, podemos criar um servidor que expÔe o serviço:

birthday_service/src/server.rs:

//! Birthday service.
use birthdayservice::BirthdayService;
use com_example_birthdayservice::aidl::com::example::birthdayservice::IBirthdayService::BnBirthdayService;
use com_example_birthdayservice::binder;

const SERVICE_IDENTIFIER: &str = "birthdayservice";

/// Ponto de entrada para serviço de aniversårio.
fn main() {
    let birthday_service = BirthdayService;
    let birthday_service_binder = BnBirthdayService::new_binder(
        birthday_service,
        binder::BinderFeatures::default(),
    );
    binder::add_service(SERVICE_IDENTIFIER, birthday_service_binder.as_binder())
        .expect("Falha ao registrar o serviço");
    binder::ProcessState::join_thread_pool()
}

birthday_service/Android.bp:

rust_binary {
    name: "birthday_server",
    crate_name: "birthday_server",
    srcs: ["src/server.rs"],
    rustlibs: [
        "com.example.birthdayservice-rust",
        "libbinder_rs",
        "libbirthdayservice",
    ],
    prefer_rlib: true,
}

Implantar

Agora podemos compilar, enviar e iniciar o serviço:

m birthday_server
adb push "$ANDROID_PRODUCT_OUT/system/bin/birthday_server /data/local/tmp"
adb shell /data/local/tmp/birthday_server

Em outro terminal, verifique se o serviço estå sendo executado:

adb shell service check birthdayservice
Service birthdayservice: found

VocĂȘ tambĂ©m pode chamar o serviço com service call:

adb shell service call birthdayservice 1 s16 Bob i32 24
Result: Parcel(
  0x00000000: 00000000 00000036 00610048 00700070 '....6...H.a.p.p.'
  0x00000010: 00200079 00690042 00740072 00640068 'y. .B.i.r.t.h.d.'
  0x00000020: 00790061 00420020 0062006f 0020002c 'a.y. .B.o.b.,. .'
  0x00000030: 006f0063 0067006e 00610072 00750074 'c.o.n.g.r.a.t.u.'
  0x00000040: 0061006c 00690074 006e006f 00200073 'l.a.t.i.o.n.s. .'
  0x00000050: 00690077 00680074 00740020 00650068 'w.i.t.h. .t.h.e.'
  0x00000060: 00320020 00200034 00650079 00720061 ' .2.4. .y.e.a.r.'
  0x00000070: 00210073 00000000                   's.!.....        ')

Cliente AIDL

Por fim, podemos criar um cliente Rust para nosso novo serviço.

birthday_server/src/client.rs:

//! Birthday service.
use com_example_birthdayservice::aidl::com::example::birthdayservice::IBirthdayService::IBirthdayService;
use com_example_birthdayservice::binder;

const SERVICE_IDENTIFIER: &str = "birthdayservice";

/// Connecta-se ao serviço de aniversårio BirthdayService.
pub fn connect() -> Result<binder::Strong<dyn IBirthdayService>, binder::StatusCode> {
    binder::get_interface(SERVICE_IDENTIFIER)
}

/// Chama o serviço de aniversårio.
fn main() -> Result<(), binder::Status> {
    let name = std::env::args()
        .nth(1)
        .unwrap_or_else(|| String::from("Bob"));
    let years = std::env::args()
        .nth(2)
        .and_then(|arg| arg.parse::<i32>().ok())
        .unwrap_or(42);

    binder::ProcessState::start_thread_pool();
    let service = connect().expect("Falha ao conectar-se a BirthdayService");
    let msg = service.wishHappyBirthday(&name, years)?;
    println!("{msg}");
    Ok(())
}

birthday_service/Android.bp:

rust_binary {
    name: "birthday_client",
    crate_name: "birthday_client",
    srcs: ["src/client.rs"],
    rustlibs: [
        "com.example.birthdayservice-rust",
        "libbinder_rs",
    ],
    prefer_rlib: true,
}

Observe que o cliente nĂŁo depende de libbirthdayservice.

Compile, envie e execute o cliente em seu dispositivo:

m birthday_client
adb push "$ANDROID_PRODUCT_OUT/system/bin/birthday_client /data/local/tmp"
adb shell /data/local/tmp/birthday_client Carlos 60
Happy Birthday Charlie, congratulations with the 60 years!

Alterando API

Vamos estender a API com mais funcionalidades: queremos permitir que os clientes especifiquem uma lista de frases para o cartĂŁo de aniversĂĄrio:

package com.example.birthdayservice;

/** Interface de serviço de aniversårio. */
interface IBirthdayService {
    /** Gera uma mensagem de feliz aniversĂĄrio. */
    String wishHappyBirthday(String name, int years, in String[] text);
}

Gerando Registros (Log)

VocĂȘ deve usar o crate log para logar automaticamente no logcat (no dispositivo) ou stdout (no host):

hello_rust_logs/Android.bp:

rust_binary {
    name: "hello_rust_logs",
    crate_name: "hello_rust_logs",
    srcs: ["src/main.rs"],
    rustlibs: [
        "liblog_rust",
        "liblogger",
    ],
    prefer_rlib: true,
    host_supported: true,
}

hello_rust_logs/src/main.rs:

//! Rust logging demo.

use log::{debug, error, info};

/// Registra uma saudação.
fn main() {
    logger::init(
        logger::Config::default()
            .with_tag_on_device("rust")
            .with_min_level(log::Level::Trace),
    );
    debug!("Iniciando programa.");
    info!("As coisas estĂŁo indo bem.");
    error!("Algo deu errado!");
}

Compile, envie e execute o binĂĄrio em seu dispositivo:

m hello_rust_logs
adb push "$ANDROID_PRODUCT_OUT/system/bin/hello_rust_logs /data/local/tmp"
adb shell /data/local/tmp/hello_rust_logs

Os logs aparecem em adb logcat:

adb logcat -s rust
09-08 08:38:32.454  2420  2420 D rust: hello_rust_logs: Starting program.
09-08 08:38:32.454  2420  2420 I rust: hello_rust_logs: Things are going fine.
09-08 08:38:32.454  2420  2420 E rust: hello_rust_logs: Something went wrong!

Interoperabilidade

O Rust tem excelente suporte para interoperabilidade com outras linguagens. Isso significa que vocĂȘ pode:

  • Chamar funçÔes Rust em outras linguagens.
  • Chamar funçÔes escritas em outras linguagens no Rust.

Quando vocĂȘ chama funçÔes em outra linguagem, dizemos que vocĂȘ estĂĄ usando uma interface de função externa, tambĂ©m conhecida como FFI.

Interoperabilidade com C

Rust tem suporte completo para vincular arquivos de objeto com uma convenção de chamada C. Da mesma forma, vocĂȘ pode exportar funçÔes Rust e chamĂĄ-las em C.

VocĂȘ pode fazer isso manualmente se quiser:

extern "C" {
    fn abs(x: i32) -> i32;
}

fn main() {
    let x = -42;
    let abs_x = unsafe { abs(x) };
    println!("{x}, {abs_x}");
}

JĂĄ vimos isso no exercĂ­cio Safe FFI Wrapper .

Isso pressupÔe conhecimento total da plataforma de destino. Não recomendado para produção.

Veremos opçÔes melhores a seguir.

Usando Bindgen

A ferramenta bindgen pode gerar vínculos (bindings) automaticamente a partir de um arquivo de cabeçalho C.

Primeiro crie uma pequena biblioteca C:

interoperability/bindgen/libbirthday.h:

typedef struct card {
  const char* name;
  int years;
} card;

void print_card(const card* card);

interoperability/bindgen/libbirthday.c:

#include <stdio.h>
#include "libbirthday.h"

void print_card(const card* card) {
  printf("+--------------\n");
  printf("|Feliz AniversĂĄrio %s!\n", card->name);
  printf("|Parabéns pelos %i anos!\n", card->years);
  printf("+--------------\n");
}

Adicione isto ao seu arquivo Android.bp:

interoperability/bindgen/Android.bp:

cc_library {
    name: "libbirthday",
    srcs: ["libbirthday.c"],
}

Crie um arquivo de cabeçalho wrapper para a biblioteca (não estritamente necessårio neste exemplo):

interoperability/bindgen/libbirthday_wrapper.h:

#include "libbirthday.h"

Agora vocĂȘ pode gerar automaticamente as vinculaçÔes (binding):

interoperability/bindgen/Android.bp:

rust_bindgen {
    name: "libbirthday_bindgen",
    crate_name: "birthday_bindgen",
    wrapper_src: "libbirthday_wrapper.h",
    source_stem: "bindings",
    static_libs: ["libbirthday"],
}

Finalmente, podemos usar as vinculaçÔes (bindings) em nosso programa Rust:

interoperability/bindgen/Android.bp:

rust_binary {
    name: "print_birthday_card",
    srcs: ["main.rs"],
    rustlibs: ["libbirthday_bindgen"],
}

interoperability/bindgen/main.rs:

//! Bindgen demo.

use birthday_bindgen::{card, print_card};

fn main() {
    let name = std::ffi::CString::new("Pedro").unwrap();
    let card = card {
        name: name.as_ptr(),
        years: 42,
    };
    unsafe {
        print_card(&card as *const card);
    }
}

Compile, envie e execute o binĂĄrio em seu dispositivo:

m print_birthday_card
adb push "$ANDROID_PRODUCT_OUT/system/bin/print_birthday_card /data/local/tmp"
adb shell /data/local/tmp/print_birthday_card

Por fim, podemos executar testes gerados automaticamente para garantir que as vinculaçÔes funcionem:

interoperability/bindgen/Android.bp:

rust_test {
    name: "libbirthday_bindgen_test",
    srcs: [":libbirthday_bindgen"],
    crate_name: "libbirthday_bindgen_test",
    test_suites: ["general-tests"],
    auto_gen_config: true,
    clippy_lints: "none", // Arquivo gerado, pule o linting
    lints: "none",
}
atest libbirthday_bindgen_test

Chamando Rust

Exportar funçÔes e tipos do Rust para C é fåcil:

interoperability/rust/libanalyze/analyze.rs

//! Rust FFI demo.
#![deny(improper_ctypes_definitions)]

use std::os::raw::c_int;

/// Analisar os nĂșmeros.
#[no_mangle]
pub extern "C" fn analyze_numbers(x: c_int, y: c_int) {
    if x < y {
        println!("x ({x}) Ă© o menor!");
    } else {
        println!("y ({y}) Ă© provavelmente maior que x ({x})");
    }
}

interoperability/rust/libanalyze/analyze.h

#ifndef ANALYSE_H
#define ANALYSE_H

extern "C" {
void analyze_numbers(int x, int y);
}

#endif

interoperability/rust/libanalyze/Android.bp

rust_ffi {
    name: "libanalyze_ffi",
    crate_name: "analyze_ffi",
    srcs: ["analyze.rs"],
    include_dirs: ["."],
}

Agora podemos chamĂĄ-lo a partir de um binĂĄrio C:

interoperability/rust/analisar/main.c

#include "analyze.h"

int main() {
  analyze_numbers(10, 20);
  analyze_numbers(123, 123);
  return 0;
}

interoperability/rust/analyze/Android.bp

cc_binary {
    name: "analyze_numbers",
    srcs: ["main.c"],
    static_libs: ["libanalyze_ffi"],
}

Compile, envie e execute o binĂĄrio em seu dispositivo:

m analyze_numbers
adb push "$ANDROID_PRODUCT_OUT/system/bin/analyze_numbers /data/local/tmp"
adb shell /data/local/tmp/analyze_numbers

#[no_mangle] desativa a alteração de name usual do Rust, entĂŁo o sĂ­mbolo exportado serĂĄ apenas o nome da função. VocĂȘ tambĂ©m pode usar #[export_name = "some_name"] para especificar qualquer nome que desejar.

Com C++

O crate CXX possibilita a interoperabilidade segura entre Rust e C++.

A abordagem geral Ă© assim:

Veja o tutorial CXX para um exemplo completo de como usĂĄ-lo.

  • At this point, the instructor should switch to the CXX tutorial.

  • Walk the students through the tutorial step by step.

  • Highlight how CXX presents a clean interface without unsafe code in both languages.

  • Show the correspondence between Rust and C++ types:

    • Explain how a Rust String cannot map to a C++ std::string (the latter does not uphold the UTF-8 invariant). Show that despite being different types, rust::String in C++ can be easily constructed from a C++ std::string, making it very ergonomic to use.

    • Explain that a Rust function returning Result<T, E> becomes a function which throws a E exception in C++ (and vice versa).

Interoperabilidade com Java

Java pode carregar objetos compartilhados via Java Native Interface (JNI). O crate jni permite que vocĂȘ crie uma biblioteca compatĂ­vel.

Primeiro, criamos uma função Rust para exportar para Java:

interoperability/java/src/lib.rs:

#![allow(unused)]
fn main() {
//! Rust <-> Java FFI demo.

use jni::objects::{JClass, JString};
use jni::sys::jstring;
use jni::JNIEnv;

/// Implementação do método HelloWorld::hello.
#[no_mangle]
pub extern "system" fn Java_HelloWorld_hello(
    env: JNIEnv,
    _class: JClass,
    name: JString,
) -> jstring {
    let input: String = env.get_string(name).unwrap().into();
    let greeting = format!("OlĂĄ, {input}!");
    let output = env.new_string(greeting).unwrap();
    output.into_inner()
}
}

interoperability/java/Android.bp:

rust_ffi_shared {
    name: "libhello_jni",
    crate_name: "hello_jni",
    srcs: ["src/lib.rs"],
    rustlibs: ["libjni"],
}

Finalmente, podemos chamar esta função do Java:

interoperability/java/HelloWorld.java:

class HelloWorld {
    private static native String hello(String name);

    static {
        System.loadLibrary("hello_jni");
    }

    public static void main(String[] args) {
        String output = HelloWorld.hello("Alice");
        System.out.println(output);
    }
}

interoperability/java/Android.bp:

java_binary {
    name: "helloworld_jni",
    srcs: ["HelloWorld.java"],
    main_class: "HelloWorld",
    required: ["libhello_jni"],
}

Por fim, vocĂȘ pode criar, sincronizar e executar o binĂĄrio:

m helloworld_jni
adb sync  # requires adb root && adb remount
adb shell /system/bin/helloworld_jni

ExercĂ­cios

Este Ă© um exercĂ­cio em grupo: NĂłs iremos ver um dos projetos com os quais vocĂȘ trabalha e tentar integrar um pouco de Rust nele. Algumas sugestĂ”es:

  • Chame seu serviço AIDL com um cliente escrito em Rust.

  • Mova uma função do seu projeto para o Rust e a chame.

Nenhuma solução Ă© fornecida aqui, pois isso Ă© aberto: depende de vocĂȘ ter uma classe tendo um pedaço de cĂłdigo que vocĂȘ pode transformar em Rust em tempo real.

Bem-vindo ao Rust Bare Metal 🩀

This is a standalone one-day course about bare-metal Rust, aimed at people who are familiar with the basics of Rust (perhaps from completing the Comprehensive Rust course), and ideally also have some experience with bare-metal programming in some other language such as C.

Today we will talk about ‘bare-metal’ Rust: running Rust code without an OS underneath us. This will be divided into several parts:

  • What is no_std Rust?
  • Writing firmware for microcontrollers.
  • Writing bootloader / kernel code for application processors.
  • Some useful crates for bare-metal Rust development.

For the microcontroller part of the course we will use the BBC micro:bit v2 as an example. It’s a development board based on the Nordic nRF51822 microcontroller with some LEDs and buttons, an I2C-connected accelerometer and compass, and an on-board SWD debugger.

To get started, install some tools we’ll need later. On gLinux or Debian:

sudo apt install gcc-aarch64-linux-gnu gdb-multiarch libudev-dev picocom pkg-config qemu-system-arm
rustup update
rustup target add aarch64-unknown-none thumbv7em-none-eabihf
rustup component add llvm-tools-preview
cargo install cargo-binutils cargo-embed

And give users in the plugdev group access to the micro:bit programmer:

echo 'SUBSYSTEM=="usb", ATTR{idVendor}=="0d28", MODE="0664", GROUP="plugdev"' |\
  sudo tee /etc/udev/rules.d/50-microbit.rules
sudo udevadm control --reload-rules

On MacOS:

xcode-select --install
brew install gdb picocom qemu
brew install --cask gcc-aarch64-embedded
rustup update
rustup target add aarch64-unknown-none thumbv7em-none-eabihf
rustup component add llvm-tools-preview
cargo install cargo-binutils cargo-embed

no_std

core

alloc

std

  • Slices, &str, CStr
  • NonZeroU8

  • Option, Result
  • Display, Debug, write!

  • Iterator (Iterador)
  • panic!, assert_eq!

  • NonNull and all the usual pointer-related functions
  • Future and async/await
  • fence, AtomicBool, AtomicPtr, AtomicU32

  • Duration
  • Box, Cow, Arc, Rc
  • Vec, BinaryHeap, BtreeMap, LinkedList, VecDeque
  • String, CString, format!
  • Error
  • HashMap
  • Mutex, Condvar, Barrier, Once, RwLock, mpsc
  • File and the rest of fs
  • println!, Read, Write, Stdin, Stdout and the rest of io
  • Path, OsString
  • net
  • Command, Child, ExitCode
  • spawn, sleep and the rest of thread
  • SystemTime, Instant
  • HashMap depends on RNG.
  • std re-exports the contents of both core and alloc.

A minimal no_std program

#![no_main]
#![no_std]

use core::panic::PanicInfo;

#[panic_handler]
fn panic(_panic: &PanicInfo) -> ! {
    loop {}
}
  • This will compile to an empty binary.
  • std provides a panic handler; without it we must provide our own.
  • It can also be provided by another crate, such as panic-halt.
  • Depending on the target, you may need to compile with panic = "abort" to avoid an error about eh_personality.
  • Note that there is no main or any other entry point; it’s up to you to define your own entry point. This will typically involve a linker script and some assembly code to set things up ready for Rust code to run.

alloc

To use alloc you must implement a global (heap) allocator.

#![no_main]
#![no_std]

extern crate alloc;
extern crate panic_halt as _;

use alloc::string::ToString;
use alloc::vec::Vec;
use buddy_system_allocator::LockedHeap;

#[global_allocator]
static HEAP_ALLOCATOR: LockedHeap<32> = LockedHeap::<32>::new();

static mut HEAP: [u8; 65536] = [0; 65536];

pub fn entry() {
    // Safe because `HEAP` is only used here and `entry` is only called once.
    unsafe {
        // Give the allocator some memory to allocate.
        HEAP_ALLOCATOR
            .lock()
            .init(HEAP.as_mut_ptr() as usize, HEAP.len());
    }

    // Now we can do things that require heap allocation.
    let mut v = Vec::new();
    v.push("A string".to_string());
}
  • buddy_system_allocator is a third-party crate implementing a basic buddy system allocator. Other crates are available, or you can write your own or hook into your existing allocator.
  • The const parameter of LockedHeap is the max order of the allocator; i.e. in this case it can allocate regions of up to 2**32 bytes.
  • If any crate in your dependency tree depends on alloc then you must have exactly one global allocator defined in your binary. Usually this is done in the top-level binary crate.
  • extern crate panic_halt as _ is necessary to ensure that the panic_halt crate is linked in so we get its panic handler.
  • This example will build but not run, as it doesn’t have an entry point.

Microcontrollers

The cortex_m_rt crate provides (among other things) a reset handler for Cortex M microcontrollers.

#![no_main]
#![no_std]

extern crate panic_halt as _;

mod interrupts;

use cortex_m_rt::entry;

#[entry]
fn main() -> ! {
    loop {}
}

Next we’ll look at how to access peripherals, with increasing levels of abstraction.

  • The cortex_m_rt::entry macro requires that the function have type fn() -> !, because returning to the reset handler doesn’t make sense.
  • Run the example with cargo embed --bin minimal

Raw MMIO

Most microcontrollers access peripherals via memory-mapped IO. Let’s try turning on an LED on our micro:bit:

#![no_main]
#![no_std]

extern crate panic_halt as _;

mod interrupts;

use core::mem::size_of;
use cortex_m_rt::entry;

/// GPIO port 0 peripheral address
const GPIO_P0: usize = 0x5000_0000;

// GPIO peripheral offsets
const PIN_CNF: usize = 0x700;
const OUTSET: usize = 0x508;
const OUTCLR: usize = 0x50c;

// PIN_CNF fields
const DIR_OUTPUT: u32 = 0x1;
const INPUT_DISCONNECT: u32 = 0x1 << 1;
const PULL_DISABLED: u32 = 0x0 << 2;
const DRIVE_S0S1: u32 = 0x0 << 8;
const SENSE_DISABLED: u32 = 0x0 << 16;

#[entry]
fn main() -> ! {
    // Configure GPIO 0 pins 21 and 28 as push-pull outputs.
    let pin_cnf_21 = (GPIO_P0 + PIN_CNF + 21 * size_of::<u32>()) as *mut u32;
    let pin_cnf_28 = (GPIO_P0 + PIN_CNF + 28 * size_of::<u32>()) as *mut u32;
    // Safe because the pointers are to valid peripheral control registers, and
    // no aliases exist.
    unsafe {
        pin_cnf_21.write_volatile(
            DIR_OUTPUT | INPUT_DISCONNECT | PULL_DISABLED | DRIVE_S0S1 | SENSE_DISABLED,
        );
        pin_cnf_28.write_volatile(
            DIR_OUTPUT | INPUT_DISCONNECT | PULL_DISABLED | DRIVE_S0S1 | SENSE_DISABLED,
        );
    }

    // Set pin 28 low and pin 21 high to turn the LED on.
    let gpio0_outset = (GPIO_P0 + OUTSET) as *mut u32;
    let gpio0_outclr = (GPIO_P0 + OUTCLR) as *mut u32;
    // Safe because the pointers are to valid peripheral control registers, and
    // no aliases exist.
    unsafe {
        gpio0_outclr.write_volatile(1 << 28);
        gpio0_outset.write_volatile(1 << 21);
    }

    loop {}
}
  • GPIO 0 pin 21 is connected to the first column of the LED matrix, and pin 28 to the first row.

Run the example with:

cargo embed --bin mmio

Peripheral Access Crates

svd2rust generates mostly-safe Rust wrappers for memory-mapped peripherals from CMSIS-SVD files.

#![no_main]
#![no_std]

extern crate panic_halt as _;

use cortex_m_rt::entry;
use nrf52833_pac::Peripherals;

#[entry]
fn main() -> ! {
    let p = Peripherals::take().unwrap();
    let gpio0 = p.P0;

    // Configure GPIO 0 pins 21 and 28 as push-pull outputs.
    gpio0.pin_cnf[21].write(|w| {
        w.dir().output();
        w.input().disconnect();
        w.pull().disabled();
        w.drive().s0s1();
        w.sense().disabled();
        w
    });
    gpio0.pin_cnf[28].write(|w| {
        w.dir().output();
        w.input().disconnect();
        w.pull().disabled();
        w.drive().s0s1();
        w.sense().disabled();
        w
    });

    // Set pin 28 low and pin 21 high to turn the LED on.
    gpio0.outclr.write(|w| w.pin28().clear());
    gpio0.outset.write(|w| w.pin21().set());

    loop {}
}
  • SVD (System View Description) files are XML files typically provided by silicon vendors which describe the memory map of the device.
    • They are organised by peripheral, register, field and value, with names, descriptions, addresses and so on.
    • SVD files are often buggy and incomplete, so there are various projects which patch the mistakes, add missing details, and publish the generated crates.
  • cortex-m-rt provides the vector table, among other things.
  • If you cargo install cargo-binutils then you can run cargo objdump --bin pac -- -d --no-show-raw-insn to see the resulting binary.

Run the example with:

cargo embed --bin pac

HAL crates

HAL crates for many microcontrollers provide wrappers around various peripherals. These generally implement traits from embedded-hal.

#![no_main]
#![no_std]

extern crate panic_halt as _;

use cortex_m_rt::entry;
use nrf52833_hal::gpio::{p0, Level};
use nrf52833_hal::pac::Peripherals;
use nrf52833_hal::prelude::*;

#[entry]
fn main() -> ! {
    let p = Peripherals::take().unwrap();

    // Create HAL wrapper for GPIO port 0.
    let gpio0 = p0::Parts::new(p.P0);

    // Configure GPIO 0 pins 21 and 28 as push-pull outputs.
    let mut col1 = gpio0.p0_28.into_push_pull_output(Level::High);
    let mut row1 = gpio0.p0_21.into_push_pull_output(Level::Low);

    // Set pin 28 low and pin 21 high to turn the LED on.
    col1.set_low().unwrap();
    row1.set_high().unwrap();

    loop {}
}
  • set_low and set_high are methods on the embedded_hal OutputPin trait.
  • HAL crates exist for many Cortex-M and RISC-V devices, including various STM32, GD32, nRF, NXP, MSP430, AVR and PIC microcontrollers.

Run the example with:

cargo embed --bin hal

Atalhos de teclado

Board support crates provide a further level of wrapping for a specific board for convenience.

#![no_main]
#![no_std]

extern crate panic_halt as _;

use cortex_m_rt::entry;
use microbit::hal::prelude::*;
use microbit::Board;

#[entry]
fn main() -> ! {
    let mut board = Board::take().unwrap();

    board.display_pins.col1.set_low().unwrap();
    board.display_pins.row1.set_high().unwrap();

    loop {}
}
  • In this case the board support crate is just providing more useful names, and a bit of initialisation.
  • The crate may also include drivers for some on-board devices outside of the microcontroller itself.
    • microbit-v2 includes a simple driver for the LED matrix.

Run the example with:

cargo embed --bin board_support

The type state pattern

#[entry]
fn main() -> ! {
    let p = Peripherals::take().unwrap();
    let gpio0 = p0::Parts::new(p.P0);

    let pin: P0_01<Disconnected> = gpio0.p0_01;

    // let gpio0_01_again = gpio0.p0_01; // Error, moved.
    let pin_input: P0_01<Input<Floating>> = pin.into_floating_input();
    if pin_input.is_high().unwrap() {
        // 

    }
    let mut pin_output: P0_01<Output<OpenDrain>> = pin_input
        .into_open_drain_output(OpenDrainConfig::Disconnect0Standard1, Level::Low);
    pin_output.set_high().unwrap();
    // pin_input.is_high(); // Error, moved.

    let _pin2: P0_02<Output<OpenDrain>> = gpio0
        .p0_02
        .into_open_drain_output(OpenDrainConfig::Disconnect0Standard1, Level::Low);
    let _pin3: P0_03<Output<PushPull>> = gpio0.p0_03.into_push_pull_output(Level::Low);

    loop {}
}
  • Pins don’t implement Copy or Clone, so only one instance of each can exist. Once a pin is moved out of the port struct nobody else can take it.
  • Changing the configuration of a pin consumes the old pin instance, so you can’t keep use the old instance afterwards.
  • The type of a value indicates the state that it is in: e.g. in this case, the configuration state of a GPIO pin. This encodes the state machine into the type system, and ensures that you don’t try to use a pin in a certain way without properly configuring it first. Illegal state transitions are caught at compile time.
  • You can call is_high on an input pin and set_high on an output pin, but not vice-versa.
  • Many HAL crates follow this pattern.

embedded-hal

The embedded-hal crate provides a number of traits covering common microcontroller peripherals.

  • GPIO
  • ADC
  • I2C, SPI, UART, CAN
  • RNG
  • Timers
  • Watchdogs

Other crates then implement drivers in terms of these traits, e.g. an accelerometer driver might need an I2C or SPI bus implementation.

  • There are implementations for many microcontrollers, as well as other platforms such as Linux on Raspberry Pi.
  • There is work in progress on an async version of embedded-hal, but it isn’t stable yet.

probe-rs, cargo-embed

probe-rs is a handy toolset for embedded debugging, like OpenOCD but better integrated.

  • SWD and JTAG via CMSIS-DAP, ST-Link and J-Link probes
  • GDB stub and Microsoft DAP server
  • Cargo integration

cargo-embed is a cargo subcommand to build and flash binaries, log RTT output and connect GDB. It’s configured by an Embed.toml file in your project directory.

  • CMSIS-DAP is an Arm standard protocol over USB for an in-circuit debugger to access the CoreSight Debug Access Port of various Arm Cortex processors. It’s what the on-board debugger on the BBC micro:bit uses.
  • ST-Link is a range of in-circuit debuggers from ST Microelectronics, J-Link is a range from SEGGER.
  • The Debug Access Port is usually either a 5-pin JTAG interface or 2-pin Serial Wire Debug.
  • probe-rs is a library which you can integrate into your own tools if you want to.
  • The Microsoft Debug Adapter Protocol lets VSCode and other IDEs debug code running on any supported microcontroller.
  • cargo-embed is a binary built using the probe-rs library.
  • RTT (Real Time Transfers) is a mechanism to transfer data between the debug host and the target through a number of ringbuffers.

Debugging

Embed.toml:

[default.general]
chip = "nrf52833_xxAA"

[debug.gdb]
enabled = true

In one terminal under src/bare-metal/microcontrollers/examples/:

cargo embed --bin board_support debug

In another terminal in the same directory:

gdb-multiarch target/thumbv7em-none-eabihf/debug/board_support --eval-command="target remote :1337"

In GDB, try running:

b src/bin/board_support.rs:29
b src/bin/board_support.rs:30
b src/bin/board_support.rs:32
c
c
c

Other projects

  • RTIC
    • “Real-Time Interrupt-driven Concurrency”
    • Shared resource management, message passing, task scheduling, timer queue
  • Embassy
    • async executors with priorities, timers, networking, USB
  • TockOS
    • Security-focused RTOS with preemptive scheduling and Memory Protection Unit support
  • Hubris
    • Microkernel RTOS from Oxide Computer Company with memory protection, unprivileged drivers, IPC
  • Bindings for FreeRTOS
  • Some platforms have std implementations, e.g. esp-idf.
  • RTIC can be considered either an RTOS or a concurrency framework.
    • It doesn’t include any HALs.
    • It uses the Cortex-M NVIC (Nested Virtual Interrupt Controller) for scheduling rather than a proper kernel.
    • Cortex-M only.
  • Google uses TockOS on the Haven microcontroller for Titan security keys.
  • FreeRTOS is mostly written in C, but there are Rust bindings for writing applications.

ExercĂ­cios

We will read the direction from an I2C compass, and log the readings to a serial port.

Depois de ver os exercĂ­cios, vocĂȘ pode ver as soluçÔes fornecidas.

BĂșssola

We will read the direction from an I2C compass, and log the readings to a serial port. If you have time, try displaying it on the LEDs somehow too, or use the buttons somehow.

Hints:

  • Check the documentation for the lsm303agr and microbit-v2 crates, as well as the micro:bit hardware.
  • The LSM303AGR Inertial Measurement Unit is connected to the internal I2C bus.
  • TWI is another name for I2C, so the I2C master peripheral is called TWIM.
  • The LSM303AGR driver needs something implementing the embedded_hal::blocking::i2c::WriteRead trait. The microbit::hal::Twim struct implements this.
  • You have a microbit::Board struct with fields for the various pins and peripherals.
  • You can also look at the nRF52833 datasheet if you want, but it shouldn’t be necessary for this exercise.

Download the exercise template and look in the compass directory for the following files.

src/main.rs:

#![no_main]
#![no_std]

extern crate panic_halt as _;

use core::fmt::Write;
use cortex_m_rt::entry;
use microbit::{hal::uarte::{Baudrate, Parity, Uarte}, Board};

#[entry]
fn main() -> ! {
    let board = Board::take().unwrap();

    // Configure serial port.
    let mut serial = Uarte::new(
        board.UARTE0,
        board.uart.into(),
        Parity::EXCLUDED,
        Baudrate::BAUD115200,
    );

    // Set up the I2C controller and Inertial Measurement Unit.
    // TODO

    writeln!(serial, "Ready.").unwrap();

    loop {
        // Read compass data and log it to the serial port.
        // TODO
    }
}

Cargo.toml (you shouldn’t need to change this):

[workspace]

[package]
name = "compass"
version = "0.1.0"
edition = "2021"
publish = false

[dependencies]
cortex-m-rt = "0.7.3"
embedded-hal = "0.2.6"
lsm303agr = "0.2.2"
microbit-v2 = "0.13.0"
panic-halt = "0.2.0"

Embed.toml (you shouldn’t need to change this):

[default.general]
chip = "nrf52833_xxAA"

[debug.gdb]
enabled = true

[debug.reset]
halt_afterwards = true

.cargo/config.toml (you shouldn’t need to change this):

[build]
target = "thumbv7em-none-eabihf" # Cortex-M4F

[target.'cfg(all(target_arch = "arm", target_os = "none"))']
rustflags = ["-C", "link-arg=-Tlink.x"]

See the serial output on Linux with:

picocom --baud 115200 --imap lfcrlf /dev/ttyACM0

Or on Mac OS something like (the device name may be slightly different):

picocom --baud 115200 --imap lfcrlf /dev/tty.usbmodem14502

Use Ctrl+A Ctrl+Q to quit picocom.

Application processors

So far we’ve talked about microcontrollers, such as the Arm Cortex-M series. Now let’s try writing something for Cortex-A. For simplicity we’ll just work with QEMU’s aarch64 ‘virt’ board.

  • Broadly speaking, microcontrollers don’t have an MMU or multiple levels of privilege (exception levels on Arm CPUs, rings on x86), while application processors do.
  • QEMU supports emulating various different machines or board models for each architecture. The ‘virt’ board doesn’t correspond to any particular real hardware, but is designed purely for virtual machines.

Getting Ready to Rust

Before we can start running Rust code, we need to do some initialisation.

.section .init.entry, "ax"
.global entry
entry:
    /*
     * Load and apply the memory management configuration, ready to enable MMU and
     * caches.
     */
    adrp x30, idmap
    msr ttbr0_el1, x30

    mov_i x30, .Lmairval
    msr mair_el1, x30

    mov_i x30, .Ltcrval
    /* Copy the supported PA range into TCR_EL1.IPS. */
    mrs x29, id_aa64mmfr0_el1
    bfi x30, x29, #32, #4

    msr tcr_el1, x30

    mov_i x30, .Lsctlrval

    /*
     * Ensure everything before this point has completed, then invalidate any
     * potentially stale local TLB entries before they start being used.
     */
    isb
    tlbi vmalle1
    ic iallu
    dsb nsh
    isb

    /*
     * Configure sctlr_el1 to enable MMU and cache and don't proceed until this
     * has completed.
     */
    msr sctlr_el1, x30
    isb

    /* Disable trapping floating point access in EL1. */
    mrs x30, cpacr_el1
    orr x30, x30, #(0x3 << 20)
    msr cpacr_el1, x30
    isb

    /* Zero out the bss section. */
    adr_l x29, bss_begin
    adr_l x30, bss_end
0:  cmp x29, x30
    b.hs 1f
    stp xzr, xzr, [x29], #16
    b 0b

1:  /* Prepare the stack. */
    adr_l x30, boot_stack_end
    mov sp, x30

    /* Set up exception vector. */
    adr x30, vector_table_el1
    msr vbar_el1, x30

    /* Call into Rust code. */
    bl main

    /* Loop forever waiting for interrupts. */
2:  wfi
    b 2b
  • This is the same as it would be for C: initialising the processor state, zeroing the BSS, and setting up the stack pointer.
    • The BSS (block starting symbol, for historical reasons) is the part of the object file which containing statically allocated variables which are initialised to zero. They are omitted from the image, to avoid wasting space on zeroes. The compiler assumes that the loader will take care of zeroing them.
  • The BSS may already be zeroed, depending on how memory is initialised and the image is loaded, but we zero it to be sure.
  • We need to enable the MMU and cache before reading or writing any memory. If we don’t:
    • Unaligned accesses will fault. We build the Rust code for the aarch64-unknown-none target which sets +strict-align to prevent the compiler generating unaligned accesses, so it should be fine in this case, but this is not necessarily the case in general.
    • If it were running in a VM, this can lead to cache coherency issues. The problem is that the VM is accessing memory directly with the cache disabled, while the host has cachable aliases to the same memory. Even if the host doesn’t explicitly access the memory, speculative accesses can lead to cache fills, and then changes from one or the other will get lost when the cache is cleaned or the VM enables the cache. (Cache is keyed by physical address, not VA or IPA.)
  • For simplicity, we just use a hardcoded pagetable (see idmap.S) which identity maps the first 1 GiB of address space for devices, the next 1 GiB for DRAM, and another 1 GiB higher up for more devices. This matches the memory layout that QEMU uses.
  • We also set up the exception vector (vbar_el1), which we’ll see more about later.
  • All examples this afternoon assume we will be running at exception level 1 (EL1). If you need to run at a different exception level you’ll need to modify entry.S accordingly.

Inline assembly

Sometimes we need to use assembly to do things that aren’t possible with Rust code. For example, to make an HVC to tell the firmware to power off the system:

#![no_main]
#![no_std]

use core::arch::asm;
use core::panic::PanicInfo;

mod exceptions;

const PSCI_SYSTEM_OFF: u32 = 0x84000008;

#[no_mangle]
extern "C" fn main(_x0: u64, _x1: u64, _x2: u64, _x3: u64) {
    // Safe because this only uses the declared registers and doesn't do
    // anything with memory.
    unsafe {
        asm!("hvc #0",
            inout("w0") PSCI_SYSTEM_OFF => _,
            inout("w1") 0 => _,
            inout("w2") 0 => _,
            inout("w3") 0 => _,
            inout("w4") 0 => _,
            inout("w5") 0 => _,
            inout("w6") 0 => _,
            inout("w7") 0 => _,
            options(nomem, nostack)
        );
    }

    loop {}
}

(If you actually want to do this, use the smccc crate which has wrappers for all these functions.)

  • PSCI is the Arm Power State Coordination Interface, a standard set of functions to manage system and CPU power states, among other things. It is implemented by EL3 firmware and hypervisors on many systems.
  • The 0 => _ syntax means initialise the register to 0 before running the inline assembly code, and ignore its contents afterwards. We need to use inout rather than in because the call could potentially clobber the contents of the registers.
  • This main function needs to be #[no_mangle] and extern "C" because it is called from our entry point in entry.S.
  • _x0–_x3 are the values of registers x0–x3, which are conventionally used by the bootloader to pass things like a pointer to the device tree. According to the standard aarch64 calling convention (which is what extern "C" specifies to use), registers x0–x7 are used for the first 8 arguments passed to a function, so entry.S doesn’t need to do anything special except make sure it doesn’t change these registers.
  • Run the example in QEMU with make qemu_psci under src/bare-metal/aps/examples.

Volatile memory access for MMIO

  • Use pointer::read_volatile and pointer::write_volatile.
  • Never hold a reference.
  • addr_of! lets you get fields of structs without creating an intermediate reference.
  • Volatile access: read or write operations may have side-effects, so prevent the compiler or hardware from reordering, duplicating or eliding them.
    • Usually if you write and then read, e.g. via a mutable reference, the compiler may assume that the value read is the same as the value just written, and not bother actually reading memory.
  • Some existing crates for volatile access to hardware do hold references, but this is unsound. Whenever a reference exist, the compiler may choose to dereference it.
  • Use the addr_of! macro to get struct field pointers from a pointer to the struct.

Let’s write a UART driver

The QEMU ‘virt’ machine has a PL011 UART, so let’s write a driver for that.

const FLAG_REGISTER_OFFSET: usize = 0x18;
const FR_BUSY: u8 = 1 << 3;
const FR_TXFF: u8 = 1 << 5;

/// Minimal driver for a PL011 UART.
#[derive(Debug)]
pub struct Uart {
    base_address: *mut u8,
}

impl Uart {
    /// Constructs a new instance of the UART driver for a PL011 device at the
    /// given base address.
    ///
    /// # Safety
    ///
    /// The given base address must point to the 8 MMIO control registers of a
    /// PL011 device, which must be mapped into the address space of the process
    /// as device memory and not have any other aliases.
    pub unsafe fn new(base_address: *mut u8) -> Self {
        Self { base_address }
    }

    /// Writes a single byte to the UART.
    pub fn write_byte(&self, byte: u8) {
        // Wait until there is room in the TX buffer.
        while self.read_flag_register() & FR_TXFF != 0 {}

        // Safe because we know that the base address points to the control
        // registers of a PL011 device which is appropriately mapped.
        unsafe {
            // Write to the TX buffer.
            self.base_address.write_volatile(byte);
        }

        // Wait until the UART is no longer busy.
        while self.read_flag_register() & FR_BUSY != 0 {}
    }

    fn read_flag_register(&self) -> u8 {
        // Safe because we know that the base address points to the control
        // registers of a PL011 device which is appropriately mapped.
        unsafe { self.base_address.add(FLAG_REGISTER_OFFSET).read_volatile() }
    }
}
  • Note that Uart::new is unsafe while the other methods are safe. This is because as long as the caller of Uart::new guarantees that its safety requirements are met (i.e. that there is only ever one instance of the driver for a given UART, and nothing else aliasing its address space), then it is always safe to call write_byte later because we can assume the necessary preconditions.
  • We could have done it the other way around (making new safe but write_byte unsafe), but that would be much less convenient to use as every place that calls write_byte would need to reason about the safety
  • This is a common pattern for writing safe wrappers of unsafe code: moving the burden of proof for soundness from a large number of places to a smaller number of places.

More traits

We derived the Debug trait. It would be useful to implement a few more traits too.

use core::fmt::{self, Write};

impl Write for Uart {
    fn write_str(&mut self, s: &str) -> fmt::Result {
        for c in s.as_bytes() {
            self.write_byte(*c);
        }
        Ok(())
    }
}

// Safe because it just contains a pointer to device memory, which can be
// accessed from any context.
unsafe impl Send for Uart {}
  • Implementing Write lets us use the write! and writeln! macros with our Uart type.
  • Run the example in QEMU with make qemu_minimal under src/bare-metal/aps/examples.

A better UART driver

The PL011 actually has a bunch more registers, and adding offsets to construct pointers to access them is error-prone and hard to read. Plus, some of them are bit fields which would be nice to access in a structured way.

OffsetRegister nameWidth
0x00DR12
0x04RSR4
0x18FR9
0x20ILPR8
0x24IBRD16
0x28FBRD6
0x2cLCR_H8
0x30CR16
0x34IFLS6
0x38IMSC11
0x3cRIS11
0x40MIS11
0x44ICR11
0x48DMACR3
  • There are also some ID registers which have been omitted for brevity.

Bitflags

The bitflags crate is useful for working with bitflags.

use bitflags::bitflags;

bitflags! {
    /// Flags from the UART flag register.
    #[repr(transparent)]
    #[derive(Copy, Clone, Debug, Eq, PartialEq)]
    struct Flags: u16 {
        /// Clear to send.
        const CTS = 1 << 0;
        /// Data set ready.
        const DSR = 1 << 1;
        /// Data carrier detect.
        const DCD = 1 << 2;
        /// UART busy transmitting data.
        const BUSY = 1 << 3;
        /// Receive FIFO is empty.
        const RXFE = 1 << 4;
        /// Transmit FIFO is full.
        const TXFF = 1 << 5;
        /// Receive FIFO is full.
        const RXFF = 1 << 6;
        /// Transmit FIFO is empty.
        const TXFE = 1 << 7;
        /// Ring indicator.
        const RI = 1 << 8;
    }
}
  • The bitflags! macro creates a newtype something like Flags(u16), along with a bunch of method implementations to get and set flags.

Multiple registers

We can use a struct to represent the memory layout of the UART’s registers.

#[repr(C, align(4))]
struct Registers {
    dr: u16,
    _reserved0: [u8; 2],
    rsr: ReceiveStatus,
    _reserved1: [u8; 19],
    fr: Flags,
    _reserved2: [u8; 6],
    ilpr: u8,
    _reserved3: [u8; 3],
    ibrd: u16,
    _reserved4: [u8; 2],
    fbrd: u8,
    _reserved5: [u8; 3],
    lcr_h: u8,
    _reserved6: [u8; 3],
    cr: u16,
    _reserved7: [u8; 3],
    ifls: u8,
    _reserved8: [u8; 3],
    imsc: u16,
    _reserved9: [u8; 2],
    ris: u16,
    _reserved10: [u8; 2],
    mis: u16,
    _reserved11: [u8; 2],
    icr: u16,
    _reserved12: [u8; 2],
    dmacr: u8,
    _reserved13: [u8; 3],
}
  • #[repr(C)] tells the compiler to lay the struct fields out in order, following the same rules as C. This is necessary for our struct to have a predictable layout, as default Rust representation allows the compiler to (among other things) reorder fields however it sees fit.

Driver

Now let’s use the new Registers struct in our driver.

/// Driver for a PL011 UART.
#[derive(Debug)]
pub struct Uart {
    registers: *mut Registers,
}

impl Uart {
    /// Constructs a new instance of the UART driver for a PL011 device at the
    /// given base address.
    ///
    /// # Safety
    ///
    /// The given base address must point to the 8 MMIO control registers of a
    /// PL011 device, which must be mapped into the address space of the process
    /// as device memory and not have any other aliases.
    pub unsafe fn new(base_address: *mut u32) -> Self {
        Self {
            registers: base_address as *mut Registers,
        }
    }

    /// Writes a single byte to the UART.
    pub fn write_byte(&self, byte: u8) {
        // Wait until there is room in the TX buffer.
        while self.read_flag_register().contains(Flags::TXFF) {}

        // Safe because we know that self.registers points to the control
        // registers of a PL011 device which is appropriately mapped.
        unsafe {
            // Write to the TX buffer.
            addr_of_mut!((*self.registers).dr).write_volatile(byte.into());
        }

        // Wait until the UART is no longer busy.
        while self.read_flag_register().contains(Flags::BUSY) {}
    }

    /// Reads and returns a pending byte, or `None` if nothing has been received.
    pub fn read_byte(&self) -> Option<u8> {
        if self.read_flag_register().contains(Flags::RXFE) {
            None
        } else {
            let data = unsafe { addr_of!((*self.registers).dr).read_volatile() };
            // TODO: Check for error conditions in bits 8-11.
            Some(data as u8)
        }
    }

    fn read_flag_register(&self) -> Flags {
        // Safe because we know that self.registers points to the control
        // registers of a PL011 device which is appropriately mapped.
        unsafe { addr_of!((*self.registers).fr).read_volatile() }
    }
}
  • Note the use of addr_of! / addr_of_mut! to get pointers to individual fields without creating an intermediate reference, which would be unsound.

Using it

Let’s write a small program using our driver to write to the serial console, and echo incoming bytes.

#![no_main]
#![no_std]

mod exceptions;
mod pl011;

use crate::pl011::Uart;
use core::fmt::Write;
use core::panic::PanicInfo;
use log::error;
use smccc::psci::system_off;
use smccc::Hvc;

/// Base address of the primary PL011 UART.
const PL011_BASE_ADDRESS: *mut u32 = 0x900_0000 as _;

#[no_mangle]
extern "C" fn main(x0: u64, x1: u64, x2: u64, x3: u64) {
    // Safe because `PL011_BASE_ADDRESS` is the base address of a PL011 device,
    // and nothing else accesses that address range.
    let mut uart = unsafe { Uart::new(PL011_BASE_ADDRESS) };

    writeln!(uart, "main({x0:#x}, {x1:#x}, {x2:#x}, {x3:#x})").unwrap();

    loop {
        if let Some(byte) = uart.read_byte() {
            uart.write_byte(byte);
            match byte {
                b'\r' => {
                    uart.write_byte(b'\n');
                }
                b'q' => break,
                _ => {}
            }
        }
    }

    writeln!(uart, "Bye!").unwrap();
    system_off::<Hvc>().unwrap();
}
  • As in the inline assembly example, this main function is called from our entry point code in entry.S. See the speaker notes there for details.
  • Run the example in QEMU with make qemu under src/bare-metal/aps/examples.

Gerando Registros (Log)

It would be nice to be able to use the logging macros from the log crate. We can do this by implementing the Log trait.

use crate::pl011::Uart;
use core::fmt::Write;
use log::{LevelFilter, Log, Metadata, Record, SetLoggerError};
use spin::mutex::SpinMutex;

static LOGGER: Logger = Logger {
    uart: SpinMutex::new(None),
};

struct Logger {
    uart: SpinMutex<Option<Uart>>,
}

impl Log for Logger {
    fn enabled(&self, _metadata: &Metadata) -> bool {
        true
    }

    fn log(&self, record: &Record) {
        writeln!(
            self.uart.lock().as_mut().unwrap(),
            "[{}] {}",
            record.level(),
            record.args()
        )
        .unwrap();
    }

    fn flush(&self) {}
}

/// Initialises UART logger.
pub fn init(uart: Uart, max_level: LevelFilter) -> Result<(), SetLoggerError> {
    LOGGER.uart.lock().replace(uart);

    log::set_logger(&LOGGER)?;
    log::set_max_level(max_level);
    Ok(())
}
  • The unwrap in log is safe because we initialise LOGGER before calling set_logger.

Using it

We need to initialise the logger before we use it.

#![no_main]
#![no_std]

mod exceptions;
mod logger;
mod pl011;

use crate::pl011::Uart;
use core::panic::PanicInfo;
use log::{error, info, LevelFilter};
use smccc::psci::system_off;
use smccc::Hvc;

/// Base address of the primary PL011 UART.
const PL011_BASE_ADDRESS: *mut u32 = 0x900_0000 as _;

#[no_mangle]
extern "C" fn main(x0: u64, x1: u64, x2: u64, x3: u64) {
    // Safe because `PL011_BASE_ADDRESS` is the base address of a PL011 device,
    // and nothing else accesses that address range.
    let uart = unsafe { Uart::new(PL011_BASE_ADDRESS) };
    logger::init(uart, LevelFilter::Trace).unwrap();

    info!("main({x0:#x}, {x1:#x}, {x2:#x}, {x3:#x})");

    assert_eq!(x1, 42);

    system_off::<Hvc>().unwrap();
}

#[panic_handler]
fn panic(info: &PanicInfo) -> ! {
    error!("{info}");
    system_off::<Hvc>().unwrap();
    loop {}
}
  • Note that our panic handler can now log details of panics.
  • Run the example in QEMU with make qemu_logger under src/bare-metal/aps/examples.

ExceçÔes

AArch64 defines an exception vector table with 16 entries, for 4 types of exceptions (synchronous, IRQ, FIQ, SError) from 4 states (current EL with SP0, current EL with SPx, lower EL using AArch64, lower EL using AArch32). We implement this in assembly to save volatile registers to the stack before calling into Rust code:

use log::error;
use smccc::psci::system_off;
use smccc::Hvc;

#[no_mangle]
extern "C" fn sync_exception_current(_elr: u64, _spsr: u64) {
    error!("sync_exception_current");
    system_off::<Hvc>().unwrap();
}

#[no_mangle]
extern "C" fn irq_current(_elr: u64, _spsr: u64) {
    error!("irq_current");
    system_off::<Hvc>().unwrap();
}

#[no_mangle]
extern "C" fn fiq_current(_elr: u64, _spsr: u64) {
    error!("fiq_current");
    system_off::<Hvc>().unwrap();
}

#[no_mangle]
extern "C" fn serr_current(_elr: u64, _spsr: u64) {
    error!("serr_current");
    system_off::<Hvc>().unwrap();
}

#[no_mangle]
extern "C" fn sync_lower(_elr: u64, _spsr: u64) {
    error!("sync_lower");
    system_off::<Hvc>().unwrap();
}

#[no_mangle]
extern "C" fn irq_lower(_elr: u64, _spsr: u64) {
    error!("irq_lower");
    system_off::<Hvc>().unwrap();
}

#[no_mangle]
extern "C" fn fiq_lower(_elr: u64, _spsr: u64) {
    error!("fiq_lower");
    system_off::<Hvc>().unwrap();
}

#[no_mangle]
extern "C" fn serr_lower(_elr: u64, _spsr: u64) {
    error!("serr_lower");
    system_off::<Hvc>().unwrap();
}
  • EL is exception level; all our examples this afternoon run in EL1.
  • For simplicity we aren’t distinguishing between SP0 and SPx for the current EL exceptions, or between AArch32 and AArch64 for the lower EL exceptions.
  • For this example we just log the exception and power down, as we don’t expect any of them to actually happen.
  • We can think of exception handlers and our main execution context more or less like different threads. Send and Sync will control what we can share between them, just like with threads. For example, if we want to share some value between exception handlers and the rest of the program, and it’s Send but not Sync, then we’ll need to wrap it in something like a Mutex and put it in a static.

Other projects

  • oreboot
    • “coreboot without the C”
    • Supports x86, aarch64 and RISC-V.
    • Relies on LinuxBoot rather than having many drivers itself.
  • Rust RaspberryPi OS tutorial
    • Initialisation, UART driver, simple bootloader, JTAG, exception levels, exception handling, page tables
    • Some dodginess around cache maintenance and initialisation in Rust, not necessarily a good example to copy for production code.
  • cargo-call-stack
    • Static analysis to determine maximum stack usage.
  • The RaspberryPi OS tutorial runs Rust code before the MMU and caches are enabled. This will read and write memory (e.g. the stack). However:
    • Without the MMU and cache, unaligned accesses will fault. It builds with aarch64-unknown-none which sets +strict-align to prevent the compiler generating unaligned accesses so it should be alright, but this is not necessarily the case in general.
    • If it were running in a VM, this can lead to cache coherency issues. The problem is that the VM is accessing memory directly with the cache disabled, while the host has cachable aliases to the same memory. Even if the host doesn’t explicitly access the memory, speculative accesses can lead to cache fills, and then changes from one or the other will get lost. Again this is alright in this particular case (running directly on the hardware with no hypervisor), but isn’t a good pattern in general.

Crates Úteis para Testes

We’ll go over a few crates which solve some common problems in bare-metal programming.

zerocopy

The zerocopy crate (from Fuchsia) provides traits and macros for safely converting between byte sequences and other types.

use zerocopy::AsBytes;

#[repr(u32)]
#[derive(AsBytes, Debug, Default)]
enum RequestType {
    #[default]
    In = 0,
    Out = 1,
    Flush = 4,
}

#[repr(C)]
#[derive(AsBytes, Debug, Default)]
struct VirtioBlockRequest {
    request_type: RequestType,
    reserved: u32,
    sector: u64,
}

fn main() {
    let request = VirtioBlockRequest {
        request_type: RequestType::Flush,
        sector: 42,
        ..Default::default()
    };

    assert_eq!(
        request.as_bytes(),
        &[4, 0, 0, 0, 0, 0, 0, 0, 42, 0, 0, 0, 0, 0, 0, 0]
    );
}

This is not suitable for MMIO (as it doesn’t use volatile reads and writes), but can be useful for working with structures shared with hardware e.g. by DMA, or sent over some external interface.

  • FromBytes can be implemented for types for which any byte pattern is valid, and so can safely be converted from an untrusted sequence of bytes.
  • Attempting to derive FromBytes for these types would fail, because RequestType doesn’t use all possible u32 values as discriminants, so not all byte patterns are valid.
  • zerocopy::byteorder has types for byte-order aware numeric primitives.
  • Run the example with cargo run under src/bare-metal/useful-crates/zerocopy-example/. (It won’t run in the Playground because of the crate dependency.)

aarch64-paging

The aarch64-paging crate lets you create page tables according to the AArch64 Virtual Memory System Architecture.

use aarch64_paging::{
    idmap::IdMap,
    paging::{Attributes, MemoryRegion},
};

const ASID: usize = 1;
const ROOT_LEVEL: usize = 1;

// Create a new page table with identity mapping.
let mut idmap = IdMap::new(ASID, ROOT_LEVEL);
// Map a 2 MiB region of memory as read-only.
idmap.map_range(
    &MemoryRegion::new(0x80200000, 0x80400000),
    Attributes::NORMAL | Attributes::NON_GLOBAL | Attributes::READ_ONLY,
).unwrap();
// Set `TTBR0_EL1` to activate the page table.
idmap.activate();
  • For now it only supports EL1, but support for other exception levels should be straightforward to add.
  • This is used in Android for the Protected VM Firmware.
  • There’s no easy way to run this example, as it needs to run on real hardware or under QEMU.

buddy_system_allocator

buddy_system_allocator is a third-party crate implementing a basic buddy system allocator. It can be used both for LockedHeap implementing GlobalAlloc so you can use the standard alloc crate (as we saw before), or for allocating other address space. For example, we might want to allocate MMIO space for PCI BARs:

use buddy_system_allocator::FrameAllocator;
use core::alloc::Layout;

fn main() {
    let mut allocator = FrameAllocator::<32>::new();
    allocator.add_frame(0x200_0000, 0x400_0000);

    let layout = Layout::from_size_align(0x100, 0x100).unwrap();
    let bar = allocator
        .alloc_aligned(layout)
        .expect("Failed to allocate 0x100 byte MMIO region");
    println!("Allocated 0x100 byte MMIO region at {:#x}", bar);
}
  • PCI BARs always have alignment equal to their size.
  • Run the example with cargo run under src/bare-metal/useful-crates/allocator-example/. (It won’t run in the Playground because of the crate dependency.)

tinyvec

Sometimes you want something which can be resized like a Vec, but without heap allocation. tinyvec provides this: a vector backed by an array or slice, which could be statically allocated or on the stack, which keeps track of how many elements are used and panics if you try to use more than are allocated.

use tinyvec::{array_vec, ArrayVec};

fn main() {
    let mut numbers: ArrayVec<[u32; 5]> = array_vec!(42, 66);
    println!("{numbers:?}");
    numbers.push(7);
    println!("{numbers:?}");
    numbers.remove(1);
    println!("{numbers:?}");
}
  • tinyvec requires that the element type implement Default for initialisation.
  • The Rust Playground includes tinyvec, so this example will run fine inline.

spin

std::sync::Mutex and the other synchronisation primitives from std::sync are not available in core or alloc. How can we manage synchronisation or interior mutability, such as for sharing state between different CPUs?

The spin crate provides spinlock-based equivalents of many of these primitives.

use spin::mutex::SpinMutex;

static counter: SpinMutex<u32> = SpinMutex::new(0);

fn main() {
    println!("count: {}", counter.lock());
    *counter.lock() += 2;
    println!("count: {}", counter.lock());
}
  • Be careful to avoid deadlock if you take locks in interrupt handlers.
  • spin also has a ticket lock mutex implementation; equivalents of RwLock, Barrier and Once from std::sync; and Lazy for lazy initialisation.
  • The once_cell crate also has some useful types for late initialisation with a slightly different approach to spin::once::Once.
  • The Rust Playground includes spin, so this example will run fine inline.

Android

To build a bare-metal Rust binary in AOSP, you need to use a rust_ffi_static Soong rule to build your Rust code, then a cc_binary with a linker script to produce the binary itself, and then a raw_binary to convert the ELF to a raw binary ready to be run.

rust_ffi_static {
    name: "libvmbase_example",
    defaults: ["vmbase_ffi_defaults"],
    crate_name: "vmbase_example",
    srcs: ["src/main.rs"],
    rustlibs: [
        "libvmbase",
    ],
}

cc_binary {
    name: "vmbase_example",
    defaults: ["vmbase_elf_defaults"],
    srcs: [
        "idmap.S",
    ],
    static_libs: [
        "libvmbase_example",
    ],
    linker_scripts: [
        "image.ld",
        ":vmbase_sections",
    ],
}

raw_binary {
    name: "vmbase_example_bin",
    stem: "vmbase_example.bin",
    src: ":vmbase_example",
    enabled: false,
    target: {
        android_arm64: {
            enabled: true,
        },
    },
}

vmbase

For VMs running under crosvm on aarch64, the vmbase library provides a linker script and useful defaults for the build rules, along with an entry point, UART console logging and more.

#![no_main]
#![no_std]

use vmbase::{main, println};

main!(main);

pub fn main(arg0: u64, arg1: u64, arg2: u64, arg3: u64) {
    println!("Hello world");
}
  • The main! macro marks your main function, to be called from the vmbase entry point.
  • The vmbase entry point handles console initialisation, and issues a PSCI_SYSTEM_OFF to shutdown the VM if your main function returns.

ExercĂ­cios

We will write a driver for the PL031 real-time clock device.

Depois de ver os exercĂ­cios, vocĂȘ pode ver as soluçÔes fornecidas.

RTC driver

The QEMU aarch64 virt machine has a PL031 real-time clock at 0x9010000. For this exercise, you should write a driver for it.

  1. Use it to print the current time to the serial console. You can use the chrono crate for date/time formatting.
  2. Use the match register and raw interrupt status to busy-wait until a given time, e.g. 3 seconds in the future. (Call core::hint::spin_loop inside the loop.)
  3. Extension if you have time: Enable and handle the interrupt generated by the RTC match. You can use the driver provided in the arm-gic crate to configure the Arm Generic Interrupt Controller.
    • Use the RTC interrupt, which is wired to the GIC as IntId::spi(2).
    • Once the interrupt is enabled, you can put the core to sleep via arm_gic::wfi(), which will cause the core to sleep until it receives an interrupt.

Download the exercise template and look in the rtc directory for the following files.

src/main.rs:

#![no_main]
#![no_std]

mod exceptions;
mod logger;
mod pl011;

use crate::pl011::Uart;
use arm_gic::gicv3::GicV3;
use core::panic::PanicInfo;
use log::{error, info, trace, LevelFilter};
use smccc::psci::system_off;
use smccc::Hvc;

/// Base addresses of the GICv3.
const GICD_BASE_ADDRESS: *mut u64 = 0x800_0000 as _;
const GICR_BASE_ADDRESS: *mut u64 = 0x80A_0000 as _;

/// Base address of the primary PL011 UART.
const PL011_BASE_ADDRESS: *mut u32 = 0x900_0000 as _;

#[no_mangle]
extern "C" fn main(x0: u64, x1: u64, x2: u64, x3: u64) {
    // Safe because `PL011_BASE_ADDRESS` is the base address of a PL011 device,
    // and nothing else accesses that address range.
    let uart = unsafe { Uart::new(PL011_BASE_ADDRESS) };
    logger::init(uart, LevelFilter::Trace).unwrap();

    info!("main({:#x}, {:#x}, {:#x}, {:#x})", x0, x1, x2, x3);

    // Safe because `GICD_BASE_ADDRESS` and `GICR_BASE_ADDRESS` are the base
    // addresses of a GICv3 distributor and redistributor respectively, and
    // nothing else accesses those address ranges.
    let mut gic = unsafe { GicV3::new(GICD_BASE_ADDRESS, GICR_BASE_ADDRESS) };
    gic.setup();

    // TODO: Create instance of RTC driver and print current time.

    // TODO: Wait for 3 seconds.

    system_off::<Hvc>().unwrap();
}

#[panic_handler]
fn panic(info: &PanicInfo) -> ! {
    error!("{info}");
    system_off::<Hvc>().unwrap();
    loop {}
}

src/exceptions.rs (you should only need to change this for the 3rd part of the exercise):

#![allow(unused)]
fn main() {
// Copyright 2023 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

use arm_gic::gicv3::GicV3;
use log::{error, info, trace};
use smccc::psci::system_off;
use smccc::Hvc;

#[no_mangle]
extern "C" fn sync_exception_current(_elr: u64, _spsr: u64) {
    error!("sync_exception_current");
    system_off::<Hvc>().unwrap();
}

#[no_mangle]
extern "C" fn irq_current(_elr: u64, _spsr: u64) {
    trace!("irq_current");
    let intid = GicV3::get_and_acknowledge_interrupt().expect("No pending interrupt");
    info!("IRQ {intid:?}");
}

#[no_mangle]
extern "C" fn fiq_current(_elr: u64, _spsr: u64) {
    error!("fiq_current");
    system_off::<Hvc>().unwrap();
}

#[no_mangle]
extern "C" fn serr_current(_elr: u64, _spsr: u64) {
    error!("serr_current");
    system_off::<Hvc>().unwrap();
}

#[no_mangle]
extern "C" fn sync_lower(_elr: u64, _spsr: u64) {
    error!("sync_lower");
    system_off::<Hvc>().unwrap();
}

#[no_mangle]
extern "C" fn irq_lower(_elr: u64, _spsr: u64) {
    error!("irq_lower");
    system_off::<Hvc>().unwrap();
}

#[no_mangle]
extern "C" fn fiq_lower(_elr: u64, _spsr: u64) {
    error!("fiq_lower");
    system_off::<Hvc>().unwrap();
}

#[no_mangle]
extern "C" fn serr_lower(_elr: u64, _spsr: u64) {
    error!("serr_lower");
    system_off::<Hvc>().unwrap();
}
}

src/logger.rs (you shouldn’t need to change this):

#![allow(unused)]
fn main() {
// Copyright 2023 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

// ANCHOR: main
use crate::pl011::Uart;
use core::fmt::Write;
use log::{LevelFilter, Log, Metadata, Record, SetLoggerError};
use spin::mutex::SpinMutex;

static LOGGER: Logger = Logger {
    uart: SpinMutex::new(None),
};

struct Logger {
    uart: SpinMutex<Option<Uart>>,
}

impl Log for Logger {
    fn enabled(&self, _metadata: &Metadata) -> bool {
        true
    }

    fn log(&self, record: &Record) {
        writeln!(
            self.uart.lock().as_mut().unwrap(),
            "[{}] {}",
            record.level(),
            record.args()
        )
        .unwrap();
    }

    fn flush(&self) {}
}

/// Initialises UART logger.
pub fn init(uart: Uart, max_level: LevelFilter) -> Result<(), SetLoggerError> {
    LOGGER.uart.lock().replace(uart);

    log::set_logger(&LOGGER)?;
    log::set_max_level(max_level);
    Ok(())
}
}

src/pl011.rs (you shouldn’t need to change this):

#![allow(unused)]
fn main() {
// Copyright 2023 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

#![allow(unused)]

use core::fmt::{self, Write};
use core::ptr::{addr_of, addr_of_mut};

// ANCHOR: Flags
use bitflags::bitflags;

bitflags! {
    /// Flags from the UART flag register.
    #[repr(transparent)]
    #[derive(Copy, Clone, Debug, Eq, PartialEq)]
    struct Flags: u16 {
        /// Clear to send.
        const CTS = 1 << 0;
        /// Data set ready.
        const DSR = 1 << 1;
        /// Data carrier detect.
        const DCD = 1 << 2;
        /// UART busy transmitting data.
        const BUSY = 1 << 3;
        /// Receive FIFO is empty.
        const RXFE = 1 << 4;
        /// Transmit FIFO is full.
        const TXFF = 1 << 5;
        /// Receive FIFO is full.
        const RXFF = 1 << 6;
        /// Transmit FIFO is empty.
        const TXFE = 1 << 7;
        /// Ring indicator.
        const RI = 1 << 8;
    }
}
// ANCHOR_END: Flags

bitflags! {
    /// Flags from the UART Receive Status Register / Error Clear Register.
    #[repr(transparent)]
    #[derive(Copy, Clone, Debug, Eq, PartialEq)]
    struct ReceiveStatus: u16 {
        /// Framing error.
        const FE = 1 << 0;
        /// Parity error.
        const PE = 1 << 1;
        /// Break error.
        const BE = 1 << 2;
        /// Overrun error.
        const OE = 1 << 3;
    }
}

// ANCHOR: Registers
#[repr(C, align(4))]
struct Registers {
    dr: u16,
    _reserved0: [u8; 2],
    rsr: ReceiveStatus,
    _reserved1: [u8; 19],
    fr: Flags,
    _reserved2: [u8; 6],
    ilpr: u8,
    _reserved3: [u8; 3],
    ibrd: u16,
    _reserved4: [u8; 2],
    fbrd: u8,
    _reserved5: [u8; 3],
    lcr_h: u8,
    _reserved6: [u8; 3],
    cr: u16,
    _reserved7: [u8; 3],
    ifls: u8,
    _reserved8: [u8; 3],
    imsc: u16,
    _reserved9: [u8; 2],
    ris: u16,
    _reserved10: [u8; 2],
    mis: u16,
    _reserved11: [u8; 2],
    icr: u16,
    _reserved12: [u8; 2],
    dmacr: u8,
    _reserved13: [u8; 3],
}
// ANCHOR_END: Registers

// ANCHOR: Uart
/// Driver for a PL011 UART.
#[derive(Debug)]
pub struct Uart {
    registers: *mut Registers,
}

impl Uart {
    /// Constructs a new instance of the UART driver for a PL011 device at the
    /// given base address.
    ///
    /// # Safety
    ///
    /// The given base address must point to the MMIO control registers of a
    /// PL011 device, which must be mapped into the address space of the process
    /// as device memory and not have any other aliases.
    pub unsafe fn new(base_address: *mut u32) -> Self {
        Self {
            registers: base_address as *mut Registers,
        }
    }

    /// Writes a single byte to the UART.
    pub fn write_byte(&self, byte: u8) {
        // Wait until there is room in the TX buffer.
        while self.read_flag_register().contains(Flags::TXFF) {}

        // Safe because we know that self.registers points to the control
        // registers of a PL011 device which is appropriately mapped.
        unsafe {
            // Write to the TX buffer.
            addr_of_mut!((*self.registers).dr).write_volatile(byte.into());
        }

        // Wait until the UART is no longer busy.
        while self.read_flag_register().contains(Flags::BUSY) {}
    }

    /// Reads and returns a pending byte, or `None` if nothing has been received.
    pub fn read_byte(&self) -> Option<u8> {
        if self.read_flag_register().contains(Flags::RXFE) {
            None
        } else {
            let data = unsafe { addr_of!((*self.registers).dr).read_volatile() };
            // TODO: Check for error conditions in bits 8-11.
            Some(data as u8)
        }
    }

    fn read_flag_register(&self) -> Flags {
        // Safe because we know that self.registers points to the control
        // registers of a PL011 device which is appropriately mapped.
        unsafe { addr_of!((*self.registers).fr).read_volatile() }
    }
}
// ANCHOR_END: Uart

impl Write for Uart {
    fn write_str(&mut self, s: &str) -> fmt::Result {
        for c in s.as_bytes() {
            self.write_byte(*c);
        }
        Ok(())
    }
}

// Safe because it just contains a pointer to device memory, which can be
// accessed from any context.
unsafe impl Send for Uart {}
}

Cargo.toml (you shouldn’t need to change this):

[workspace]

[package]
name = "rtc"
version = "0.1.0"
edition = "2021"
publish = false

[dependencies]
arm-gic = "0.1.0"
bitflags = "2.0.0"
chrono = { version = "0.4.24", default-features = false }
log = "0.4.17"
smccc = "0.1.1"
spin = "0.9.8"

[build-dependencies]
cc = "1.0.73"

build.rs (you shouldn’t need to change this):

// Copyright 2023 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

use cc::Build;
use std::env;

fn main() {
    #[cfg(target_os = "linux")]
    env::set_var("CROSS_COMPILE", "aarch64-linux-gnu");
    #[cfg(not(target_os = "linux"))]
    env::set_var("CROSS_COMPILE", "aarch64-none-elf");

    Build::new()
        .file("entry.S")
        .file("exceptions.S")
        .file("idmap.S")
        .compile("empty")
}

entry.S (you shouldn’t need to change this):

/*
 * Copyright 2023 Google LLC
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *     https://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

.macro adr_l, reg:req, sym:req
	adrp \reg, \sym
	add \reg, \reg, :lo12:\sym
.endm

.macro mov_i, reg:req, imm:req
	movz \reg, :abs_g3:\imm
	movk \reg, :abs_g2_nc:\imm
	movk \reg, :abs_g1_nc:\imm
	movk \reg, :abs_g0_nc:\imm
.endm

.set .L_MAIR_DEV_nGnRE,	0x04
.set .L_MAIR_MEM_WBWA,	0xff
.set .Lmairval, .L_MAIR_DEV_nGnRE | (.L_MAIR_MEM_WBWA << 8)

/* 4 KiB granule size for TTBR0_EL1. */
.set .L_TCR_TG0_4KB, 0x0 << 14
/* 4 KiB granule size for TTBR1_EL1. */
.set .L_TCR_TG1_4KB, 0x2 << 30
/* Disable translation table walk for TTBR1_EL1, generating a translation fault instead. */
.set .L_TCR_EPD1, 0x1 << 23
/* Translation table walks for TTBR0_EL1 are inner sharable. */
.set .L_TCR_SH_INNER, 0x3 << 12
/*
 * Translation table walks for TTBR0_EL1 are outer write-back read-allocate write-allocate
 * cacheable.
 */
.set .L_TCR_RGN_OWB, 0x1 << 10
/*
 * Translation table walks for TTBR0_EL1 are inner write-back read-allocate write-allocate
 * cacheable.
 */
.set .L_TCR_RGN_IWB, 0x1 << 8
/* Size offset for TTBR0_EL1 is 2**39 bytes (512 GiB). */
.set .L_TCR_T0SZ_512, 64 - 39
.set .Ltcrval, .L_TCR_TG0_4KB | .L_TCR_TG1_4KB | .L_TCR_EPD1 | .L_TCR_RGN_OWB
.set .Ltcrval, .Ltcrval | .L_TCR_RGN_IWB | .L_TCR_SH_INNER | .L_TCR_T0SZ_512

/* Stage 1 instruction access cacheability is unaffected. */
.set .L_SCTLR_ELx_I, 0x1 << 12
/* SP alignment fault if SP is not aligned to a 16 byte boundary. */
.set .L_SCTLR_ELx_SA, 0x1 << 3
/* Stage 1 data access cacheability is unaffected. */
.set .L_SCTLR_ELx_C, 0x1 << 2
/* EL0 and EL1 stage 1 MMU enabled. */
.set .L_SCTLR_ELx_M, 0x1 << 0
/* Privileged Access Never is unchanged on taking an exception to EL1. */
.set .L_SCTLR_EL1_SPAN, 0x1 << 23
/* SETEND instruction disabled at EL0 in aarch32 mode. */
.set .L_SCTLR_EL1_SED, 0x1 << 8
/* Various IT instructions are disabled at EL0 in aarch32 mode. */
.set .L_SCTLR_EL1_ITD, 0x1 << 7
.set .L_SCTLR_EL1_RES1, (0x1 << 11) | (0x1 << 20) | (0x1 << 22) | (0x1 << 28) | (0x1 << 29)
.set .Lsctlrval, .L_SCTLR_ELx_M | .L_SCTLR_ELx_C | .L_SCTLR_ELx_SA | .L_SCTLR_EL1_ITD | .L_SCTLR_EL1_SED
.set .Lsctlrval, .Lsctlrval | .L_SCTLR_ELx_I | .L_SCTLR_EL1_SPAN | .L_SCTLR_EL1_RES1

/**
 * This is a generic entry point for an image. It carries out the operations required to prepare the
 * loaded image to be run. Specifically, it zeroes the bss section using registers x25 and above,
 * prepares the stack, enables floating point, and sets up the exception vector. It preserves x0-x3
 * for the Rust entry point, as these may contain boot parameters.
 */
.section .init.entry, "ax"
.global entry
entry:
	/* Load and apply the memory management configuration, ready to enable MMU and caches. */
	adrp x30, idmap
	msr ttbr0_el1, x30

	mov_i x30, .Lmairval
	msr mair_el1, x30

	mov_i x30, .Ltcrval
	/* Copy the supported PA range into TCR_EL1.IPS. */
	mrs x29, id_aa64mmfr0_el1
	bfi x30, x29, #32, #4

	msr tcr_el1, x30

	mov_i x30, .Lsctlrval

	/*
	 * Ensure everything before this point has completed, then invalidate any potentially stale
	 * local TLB entries before they start being used.
	 */
	isb
	tlbi vmalle1
	ic iallu
	dsb nsh
	isb

	/*
	 * Configure sctlr_el1 to enable MMU and cache and don't proceed until this has completed.
	 */
	msr sctlr_el1, x30
	isb

	/* Disable trapping floating point access in EL1. */
	mrs x30, cpacr_el1
	orr x30, x30, #(0x3 << 20)
	msr cpacr_el1, x30
	isb

	/* Zero out the bss section. */
	adr_l x29, bss_begin
	adr_l x30, bss_end
0:	cmp x29, x30
	b.hs 1f
	stp xzr, xzr, [x29], #16
	b 0b

1:	/* Prepare the stack. */
	adr_l x30, boot_stack_end
	mov sp, x30

	/* Set up exception vector. */
	adr x30, vector_table_el1
	msr vbar_el1, x30

	/* Call into Rust code. */
	bl main

	/* Loop forever waiting for interrupts. */
2:	wfi
	b 2b

exceptions.S (you shouldn’t need to change this):

/*
 * Copyright 2023 Google LLC
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *     https://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

/**
 * Saves the volatile registers onto the stack. This currently takes 14
 * instructions, so it can be used in exception handlers with 18 instructions
 * left.
 *
 * On return, x0 and x1 are initialised to elr_el2 and spsr_el2 respectively,
 * which can be used as the first and second arguments of a subsequent call.
 */
.macro save_volatile_to_stack
	/* Reserve stack space and save registers x0-x18, x29 & x30. */
	stp x0, x1, [sp, #-(8 * 24)]!
	stp x2, x3, [sp, #8 * 2]
	stp x4, x5, [sp, #8 * 4]
	stp x6, x7, [sp, #8 * 6]
	stp x8, x9, [sp, #8 * 8]
	stp x10, x11, [sp, #8 * 10]
	stp x12, x13, [sp, #8 * 12]
	stp x14, x15, [sp, #8 * 14]
	stp x16, x17, [sp, #8 * 16]
	str x18, [sp, #8 * 18]
	stp x29, x30, [sp, #8 * 20]

	/*
	 * Save elr_el1 & spsr_el1. This such that we can take nested exception
	 * and still be able to unwind.
	 */
	mrs x0, elr_el1
	mrs x1, spsr_el1
	stp x0, x1, [sp, #8 * 22]
.endm

/**
 * Restores the volatile registers from the stack. This currently takes 14
 * instructions, so it can be used in exception handlers while still leaving 18
 * instructions left; if paired with save_volatile_to_stack, there are 4
 * instructions to spare.
 */
.macro restore_volatile_from_stack
	/* Restore registers x2-x18, x29 & x30. */
	ldp x2, x3, [sp, #8 * 2]
	ldp x4, x5, [sp, #8 * 4]
	ldp x6, x7, [sp, #8 * 6]
	ldp x8, x9, [sp, #8 * 8]
	ldp x10, x11, [sp, #8 * 10]
	ldp x12, x13, [sp, #8 * 12]
	ldp x14, x15, [sp, #8 * 14]
	ldp x16, x17, [sp, #8 * 16]
	ldr x18, [sp, #8 * 18]
	ldp x29, x30, [sp, #8 * 20]

	/* Restore registers elr_el1 & spsr_el1, using x0 & x1 as scratch. */
	ldp x0, x1, [sp, #8 * 22]
	msr elr_el1, x0
	msr spsr_el1, x1

	/* Restore x0 & x1, and release stack space. */
	ldp x0, x1, [sp], #8 * 24
.endm

/**
 * This is a generic handler for exceptions taken at the current EL while using
 * SP0. It behaves similarly to the SPx case by first switching to SPx, doing
 * the work, then switching back to SP0 before returning.
 *
 * Switching to SPx and calling the Rust handler takes 16 instructions. To
 * restore and return we need an additional 16 instructions, so we can implement
 * the whole handler within the allotted 32 instructions.
 */
.macro current_exception_sp0 handler:req
	msr spsel, #1
	save_volatile_to_stack
	bl \handler
	restore_volatile_from_stack
	msr spsel, #0
	eret
.endm

/**
 * This is a generic handler for exceptions taken at the current EL while using
 * SPx. It saves volatile registers, calls the Rust handler, restores volatile
 * registers, then returns.
 *
 * This also works for exceptions taken from EL0, if we don't care about
 * non-volatile registers.
 *
 * Saving state and jumping to the Rust handler takes 15 instructions, and
 * restoring and returning also takes 15 instructions, so we can fit the whole
 * handler in 30 instructions, under the limit of 32.
 */
.macro current_exception_spx handler:req
	save_volatile_to_stack
	bl \handler
	restore_volatile_from_stack
	eret
.endm

.section .text.vector_table_el1, "ax"
.global vector_table_el1
.balign 0x800
vector_table_el1:
sync_cur_sp0:
	current_exception_sp0 sync_exception_current

.balign 0x80
irq_cur_sp0:
	current_exception_sp0 irq_current

.balign 0x80
fiq_cur_sp0:
	current_exception_sp0 fiq_current

.balign 0x80
serr_cur_sp0:
	current_exception_sp0 serr_current

.balign 0x80
sync_cur_spx:
	current_exception_spx sync_exception_current

.balign 0x80
irq_cur_spx:
	current_exception_spx irq_current

.balign 0x80
fiq_cur_spx:
	current_exception_spx fiq_current

.balign 0x80
serr_cur_spx:
	current_exception_spx serr_current

.balign 0x80
sync_lower_64:
	current_exception_spx sync_lower

.balign 0x80
irq_lower_64:
	current_exception_spx irq_lower

.balign 0x80
fiq_lower_64:
	current_exception_spx fiq_lower

.balign 0x80
serr_lower_64:
	current_exception_spx serr_lower

.balign 0x80
sync_lower_32:
	current_exception_spx sync_lower

.balign 0x80
irq_lower_32:
	current_exception_spx irq_lower

.balign 0x80
fiq_lower_32:
	current_exception_spx fiq_lower

.balign 0x80
serr_lower_32:
	current_exception_spx serr_lower

idmap.S (you shouldn’t need to change this):

/*
 * Copyright 2023 Google LLC
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *     https://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

.set .L_TT_TYPE_BLOCK, 0x1
.set .L_TT_TYPE_PAGE,  0x3
.set .L_TT_TYPE_TABLE, 0x3

/* Access flag. */
.set .L_TT_AF, 0x1 << 10
/* Not global. */
.set .L_TT_NG, 0x1 << 11
.set .L_TT_XN, 0x3 << 53

.set .L_TT_MT_DEV, 0x0 << 2			// MAIR #0 (DEV_nGnRE)
.set .L_TT_MT_MEM, (0x1 << 2) | (0x3 << 8)	// MAIR #1 (MEM_WBWA), inner shareable

.set .L_BLOCK_DEV, .L_TT_TYPE_BLOCK | .L_TT_MT_DEV | .L_TT_AF | .L_TT_XN
.set .L_BLOCK_MEM, .L_TT_TYPE_BLOCK | .L_TT_MT_MEM | .L_TT_AF | .L_TT_NG

.section ".rodata.idmap", "a", %progbits
.global idmap
.align 12
idmap:
	/* level 1 */
	.quad		.L_BLOCK_DEV | 0x0		    // 1 GiB of device mappings
	.quad		.L_BLOCK_MEM | 0x40000000	// 1 GiB of DRAM
	.fill		254, 8, 0x0			// 254 GiB of unmapped VA space
	.quad		.L_BLOCK_DEV | 0x4000000000 // 1 GiB of device mappings
	.fill		255, 8, 0x0			// 255 GiB of remaining VA space

image.ld (you shouldn’t need to change this):

/*
 * Copyright 2023 Google LLC
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *     https://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

/*
 * Code will start running at this symbol which is placed at the start of the
 * image.
 */
ENTRY(entry)

MEMORY
{
	image : ORIGIN = 0x40080000, LENGTH = 2M
}

SECTIONS
{
	/*
	 * Collect together the code.
	 */
	.init : ALIGN(4096) {
		text_begin = .;
		*(.init.entry)
		*(.init.*)
	} >image
	.text : {
		*(.text.*)
	} >image
	text_end = .;

	/*
	 * Collect together read-only data.
	 */
	.rodata : ALIGN(4096) {
		rodata_begin = .;
		*(.rodata.*)
	} >image
	.got : {
		*(.got)
	} >image
	rodata_end = .;

	/*
	 * Collect together the read-write data including .bss at the end which
	 * will be zero'd by the entry code.
	 */
	.data : ALIGN(4096) {
		data_begin = .;
		*(.data.*)
		/*
		 * The entry point code assumes that .data is a multiple of 32
		 * bytes long.
		 */
		. = ALIGN(32);
		data_end = .;
	} >image

	/* Everything beyond this point will not be included in the binary. */
	bin_end = .;

	/* The entry point code assumes that .bss is 16-byte aligned. */
	.bss : ALIGN(16)  {
		bss_begin = .;
		*(.bss.*)
		*(COMMON)
		. = ALIGN(16);
		bss_end = .;
	} >image

	.stack (NOLOAD) : ALIGN(4096) {
		boot_stack_begin = .;
		. += 40 * 4096;
		. = ALIGN(4096);
		boot_stack_end = .;
	} >image

	. = ALIGN(4K);
	PROVIDE(dma_region = .);

	/*
	 * Remove unused sections from the image.
	 */
	/DISCARD/ : {
		/* The image loads itself so doesn't need these sections. */
		*(.gnu.hash)
		*(.hash)
		*(.interp)
		*(.eh_frame_hdr)
		*(.eh_frame)
		*(.note.gnu.build-id)
	}
}

Makefile (you shouldn’t need to change this):

# Copyright 2023 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#      http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

UNAME := $(shell uname -s)
ifeq ($(UNAME),Linux)
	TARGET = aarch64-linux-gnu
else
	TARGET = aarch64-none-elf
endif
OBJCOPY = $(TARGET)-objcopy

.PHONY: build qemu_minimal qemu qemu_logger

all: rtc.bin

build:
	cargo build

rtc.bin: build
	$(OBJCOPY) -O binary target/aarch64-unknown-none/debug/rtc $@

qemu: rtc.bin
	qemu-system-aarch64 -machine virt,gic-version=3 -cpu max -serial mon:stdio -display none -kernel $< -s

clean:
	cargo clean
	rm -f *.bin

.cargo/config.toml (you shouldn’t need to change this):

[build]
target = "aarch64-unknown-none"
rustflags = ["-C", "link-arg=-Timage.ld"]

Run the code in QEMU with make qemu.

Welcome to Concurrency in Rust

Rust tem suporte total para concorrĂȘncia usando threads do SO com mutexes e channels (canais).

O sistema de tipos do Rust desempenha um papel importante na conversĂŁo de muitos erros de concorrĂȘncia em erros de tempo de compilação. Isso geralmente Ă© chamado de concorrĂȘncia sem medo, pois vocĂȘ pode confiar no compilador para garantir a exatidĂŁo no tempo de execução.

Threads

Threads em Rust funcionam de maneira semelhante Ă s threads em outras linguagens:

use std::thread;
use std::time::Duration;

fn main() {
    thread::spawn(|| {
        for i in 1..10 {
            println!("Count in thread: {i}!");
            thread::sleep(Duration::from_millis(5));
        }
    });

    for i in 1..5 {
        println!("Main thread: {i}");
        thread::sleep(Duration::from_millis(5));
    }
}
  • Threads sĂŁo todas “daemon threads”, o thread principal nĂŁo espera por elas.
  • “Panics” em threads sĂŁo independentes uns dos outros.
    • “Panics” podem carregar um payload (carga Ăștil), que pode ser descompactado com downcast_ref.

Pontos chave:

  • Notice that the thread is stopped before it reaches 10 — the main thread is not waiting.

  • Use let handle = thread::spawn(...) and later handle.join() to wait for the thread to finish.

  • Trigger a panic in the thread, notice how this doesn’t affect main.

  • Use the Result return value from handle.join() to get access to the panic payload. This is a good time to talk about Any.

Threads com Escopo

Threads normais nĂŁo podem emprestar de seu ambiente:

use std::thread;

fn foo() {
    let s = String::from("OlĂĄ");
    thread::spawn(|| {
        println!("Length: {}", s.len());
    });
}

fn main() {
    foo();
}

No entanto, vocĂȘ pode usar uma thread com escopo para isso:

use std::thread;

fn main() {
    let s = String::from("OlĂĄ");

    thread::scope(|scope| {
        scope.spawn(|| {
            println!("Length: {}", s.len());
        });
    });
}
  • The reason for that is that when the thread::scope function completes, all the threads are guaranteed to be joined, so they can return borrowed data.
  • Normal Rust borrowing rules apply: you can either borrow mutably by one thread, or immutably by any number of threads.

Canais (channels)

Os channels (canais) em Rust tĂȘm duas partes: um Sender<T> e um Receiver<T>. As duas partes estĂŁo conectadas atravĂ©s do channel, mas vocĂȘ sĂł vĂȘ os end-points.

use std::sync::mpsc;
use std::thread;

fn main() {
    let (tx, rx) = mpsc::channel();

    tx.send(10).unwrap();
    tx.send(20).unwrap();

    println!("Received: {:?}", rx.recv());
    println!("Received: {:?}", rx.recv());

    let tx2 = tx.clone();
    tx2.send(30).unwrap();
    println!("Received: {:?}", rx.recv());
}
  • mpsc significa Multi-Produtor, Único-Consumidor. Sender e SyncSender implementam Clone (entĂŁo vocĂȘ pode criar vĂĄrios produtores), mas Receiver (consumidores) nĂŁo.
  • send() e recv() retornam Result. Se retornarem Err, significa que a contraparte Sender ou Receiver Ă© descartada e o canal Ă© fechado.

Canais Ilimitados

VocĂȘ obtĂ©m um canal ilimitado e assĂ­ncrono com mpsc::channel():

use std::sync::mpsc;
use std::thread;
use std::time::Duration;

fn main() {
    let (tx, rx) = mpsc::channel();

    thread::spawn(move || {
        let thread_id = thread::current().id();
        for i in 1..10 {
            tx.send(format!("Message {i}")).unwrap();
            println!("{thread_id:?}: sent Message {i}");
        }
        println!("{thread_id:?}: done");
    });
    thread::sleep(Duration::from_millis(100));

    for msg in rx.iter() {
        println!("Main: got {msg}");
    }
}

Canais Delimitados

With bounded (synchronous) channels, send can block the current thread:

use std::sync::mpsc;
use std::thread;
use std::time::Duration;

fn main() {
    let (tx, rx) = mpsc::sync_channel(3);

    thread::spawn(move || {
        let thread_id = thread::current().id();
        for i in 1..10 {
            tx.send(format!("Message {i}")).unwrap();
            println!("{thread_id:?}: sent Message {i}");
        }
        println!("{thread_id:?}: done");
    });
    thread::sleep(Duration::from_millis(100));

    for msg in rx.iter() {
        println!("Main: got {msg}");
    }
}
  • Calling send will block the current thread until there is space in the channel for the new message. The thread can be blocked indefinitely if there is nobody who reads from the channel.
  • A call to send will abort with an error (that is why it returns Result) if the channel is closed. A channel is closed when the receiver is dropped.
  • A bounded channel with a size of zero is called a “rendezvous channel”. Every send will block the current thread until another thread calls read.

Send e Sync

Como o Rust sabe proibir o acesso compartilhado entre threads? A resposta estĂĄ em duas caracterĂ­sticas:

  • Send: um tipo T Ă© Send se for seguro mover um T entre threads
  • Sync: um tipo T Ă© Sync se for seguro mover um &T entre threads

Send e Sync sĂŁo unsafe traits. O compilador os derivarĂĄ automaticamente para seus tipos desde que contenham apenas os tipos Send e Sync. VocĂȘ tambĂ©m pode implementĂĄ-los manualmente quando souber que sĂŁo vĂĄlidos.

  • One can think of these traits as markers that the type has certain thread-safety properties.
  • They can be used in the generic constraints as normal traits.

Send

Um tipo T Ă© Send se for seguro mover um valor T para outro thread.

O efeito de mover a propriedade (ownership) para outro thread Ă© que os destructors serĂŁo executados nessa thread. EntĂŁo a questĂŁo Ă©: quando vocĂȘ pode alocar um valor em um thread e desalocĂĄ-lo em outro?

As an example, a connection to the SQLite library must only be accessed from a single thread.

Sync

Um tipo T Ă© Sync se for seguro acessar um valor T de vĂĄrias threads ao mesmo tempo.

Mais precisamente, a definição é:

T Ă© Sync se e somente se &T Ă© Send

Essa instrução Ă© essencialmente uma maneira abreviada de dizer que, se um tipo Ă© thread-safe para uso compartilhado, tambĂ©m Ă© thread-safe passar referĂȘncias a ele entre threads.

Isso ocorre porque, se um tipo for Sync, significa que ele pode ser compartilhado entre vĂĄrios threads sem o risco de corridas de dados ou outros problemas de sincronização, portanto, Ă© seguro movĂȘ-lo para outro thread. Uma referĂȘncia ao tipo tambĂ©m Ă© segura para mover para outro thread, porque os dados a que ela faz referĂȘncia podem ser acessados de qualquer thread com segurança.

Exemplos

Send + Sync

A maioria dos tipos que vocĂȘ encontra sĂŁo Send + Sync:

  • i8, f32, bool, char, &str, 

  • (T1, T2), [T; N], &[T], struct { x: T }, 

  • String, Option<T>, Vec<T>, Box<T>, 

  • Arc<T>: Explicitamente thread-safe via contagem de referĂȘncia atĂŽmica.
  • Mutex<T>: Explicitamente thread-safe via bloqueio interno.
  • AtomicBool, AtomicU8, 
: Usa instruçÔes atĂŽmicas especiais.

Os tipos genéricos são tipicamente Send + Sync quando os parùmetros de tipo são Send + Sync.

Send + !Sync

Esses tipos podem ser movidos para outras threads, mas nĂŁo sĂŁo seguros para threads. Normalmente por causa da mutabilidade interior:

  • mpsc::Sender<T>
  • mpsc::Receiver<T>
  • Cell<T>
  • RefCell<T>

!Send + Sync

Esses tipos sĂŁo thread-safe, mas nĂŁo podem ser movidos para outro thread:

  • MutexGuard<T>: Usa primitivas a nĂ­vel de sistema operacional que devem ser desalocadas no thread que as criou.

!Send + !Sync

Esses tipos nĂŁo sĂŁo thread-safe e nĂŁo podem ser movidos para outros threads:

  • Rc<T>: cada Rc<T> tem uma referĂȘncia a um RcBox<T>, que contĂ©m uma contagem de referĂȘncia nĂŁo atĂŽmica.
  • *const T, *mut T: Rust assume que ponteiros brutos podem ter consideraçÔes de especiais de concorrĂȘncia.

Estado Compartilhado

Rust usa o sistema de tipos para impor a sincronização de dados compartilhados. Isso é feito principalmente através de dois tipos:

  • Arc<T>, referĂȘncia atĂŽmica contada T: manipula o compartilhamento entre threads e toma o cuidado de desalocar T quando a Ășltima referĂȘncia Ă© descartada,
  • Mutex<T>: garante acesso mutuamente exclusivo ao valor T.

Arc

Arc<T> allows shared read-only access via Arc::clone:

use std::thread;
use std::sync::Arc;

fn main() {
    let v = Arc::new(vec![10, 20, 30]);
    let mut handles = Vec::new();
    for _ in 1..5 {
        let v = Arc::clone(&v);
        handles.push(thread::spawn(move || {
            let thread_id = thread::current().id();
            println!("{thread_id:?}: {v:?}");
        }));
    }

    handles.into_iter().for_each(|h| h.join().unwrap());
    println!("v: {v:?}");
}
  • Arc significa “Atomic Reference Counted”, uma versĂŁo thread-safe de Rc que usa operaçÔes atĂŽmicas.
  • Arc<T> implements Clone whether or not T does. It implements Send and Sync if and only if T implements them both.
  • Arc::clone() tem o custo das operaçÔes atĂŽmicas que sĂŁo executadas, mas depois disso o uso do T Ă© gratuito.
  • Cuidado com os ciclos de referĂȘncia, Arc nĂŁo usa um coletor de lixo para detectĂĄ-los.
    • std::sync::Weak pode ajudar.

Mutex

Mutex<T> garante exclusĂŁo mĂștua e permite acesso mutĂĄvel a T por trĂĄs de uma interface somente leitura:

use std::sync::Mutex;

fn main() {
    let v = Mutex::new(vec![10, 20, 30]);
    println!("v: {:?}", v.lock().unwrap());

    {
        let mut guard = v.lock().unwrap();
        guard.push(40);
    }

    println!("v: {:?}", v.lock().unwrap());
}

Observe como temos uma implementação impl<T: Send> Sync for Mutex<T> encoberta.

  • Mutex in Rust looks like a collection with just one element - the protected data.
    • It is not possible to forget to acquire the mutex before accessing the protected data.
  • You can get an &mut T from an &Mutex<T> by taking the lock. The MutexGuard ensures that the &mut T doesn’t outlive the lock being held.
  • Mutex<T> implements both Send and Sync iff (if and only if) T implements Send.
  • A read-write lock counterpart - RwLock.
  • Why does lock() return a Result?
    • If the thread that held the Mutex panicked, the Mutex becomes “poisoned” to signal that the data it protected might be in an inconsistent state. Calling lock() on a poisoned mutex fails with a PoisonError. You can call into_inner() on the error to recover the data regardless.

Exemplo

Vamos ver Arc e Mutex em ação:

use std::thread;
// use std::sync::{Arc, Mutex};

fn main() {
    let v = vec![10, 20, 30];
    let handle = thread::spawn(|| {
        v.push(10);
    });
    v.push(1000);

    handle.join().unwrap();
    println!("v: {v:?}");
}

Possible solution:

use std::sync::{Arc, Mutex};
use std::thread;

fn main() {
    let v = Arc::new(Mutex::new(vec![10, 20, 30]));

    let v2 = Arc::clone(&v);
    let handle = thread::spawn(move || {
        let mut v2 = v2.lock().unwrap();
        v2.push(10);
    });

    {
        let mut v = v.lock().unwrap();
        v.push(1000);
    }

    handle.join().unwrap();

    println!("v: {v:?}");
}

Notable parts:

  • v is wrapped in both Arc and Mutex, because their concerns are orthogonal.
    • Wrapping a Mutex in an Arc is a common pattern to share mutable state between threads.
  • v: Arc<_> needs to be cloned as v2 before it can be moved into another thread. Note move was added to the lambda signature.
  • Blocks are introduced to narrow the scope of the LockGuard as much as possible.

ExercĂ­cios

Vamos praticar nossas novas habilidades de concorrĂȘncia com:

  • Dining philosophers: a classic problem in concurrency.

  • Multi-threaded link checker: a larger project where you’ll use Cargo to download dependencies and then check links in parallel.

Depois de ver os exercĂ­cios, vocĂȘ pode ver as soluçÔes fornecidas.

FilĂłsofos Jantando

O problema dos filĂłsofos jantando Ă© um problema clĂĄssico em concorrĂȘncia:

Cinco filĂłsofos jantam juntos na mesma mesa. Cada folĂłsofo tem seu prĂłprio lugar Ă  mesa. HĂĄ um garfo entre cada prato. O prato servido Ă© uma espĂ©cie de espaguete que se come com dois garfos. Cada filĂłsofo pode somente pensar ou comer, alternadamente. AlĂ©m disso, um filĂłsofo sĂł pode comer seu espaguete quando ele tĂȘm garfo esquerdo e direito. Assim, dois garfos sĂł estarĂŁo disponĂ­veis quando seus dois vizinhos mais prĂłximos estiverem pensando, nĂŁo comendo. Depois de um filĂłsofo individual termina de comer, ele abaixa os dois garfos.

You will need a local Cargo installation for this exercise. Copy the code below to a file called src/main.rs, fill out the blanks, and test that cargo run does not deadlock:

use std::sync::{mpsc, Arc, Mutex};
use std::thread;
use std::time::Duration;

struct Fork;

struct Philosopher {
    name: String,
    // left_fork: ...
    // right_fork: ...
    // thoughts: ...
}

impl Philosopher {
    fn think(&self) {
        self.thoughts
            .send(format!("Eureka! {} has a new idea!", &self.name))
            .unwrap();
    }

    fn eat(&self) {
        // Pick up forks...
        println!("{} is eating...", &self.name);
        thread::sleep(Duration::from_millis(10));
    }
}

static PHILOSOPHERS: &[&str] =
    &["Socrates", "Plato", "Aristotle", "Thales", "Pythagoras"];

fn main() {
    // Create forks

    // Create philosophers

    // Make each of them think and eat 100 times

    // Output their thoughts
}

You can use the following Cargo.toml:

[package]
name = "dining-philosophers"
version = "0.1.0"
edition = "2021"

Verificador de Links Multi-Threads

Vamos usar nosso novo conhecimento para criar um verificador de links multi-threads. Comece em uma pågina da web e verifique se os links na pågina são vålidos. Verifique recursivamente outras påginas no mesmo domínio e continue fazendo isso até que todas as påginas tenham sido validadas.

Para isso, vocĂȘ precisarĂĄ de um cliente HTTP como reqwest. Crie um novo Project com o Cargo e adicione reqwest como uma dependĂȘncia:

cargo new link-checker
cd link-checker
cargo add --features blocking,rustls-tls reqwest

Se cargo add falhar com error: no such subcommand, edite o arquivo Cargo.toml Ă  mĂŁo. Adicione as dependĂȘncias listadas abaixo.

VocĂȘ tambĂ©m precisarĂĄ de uma maneira de encontrar links. Podemos usar scraper para isso:

cargo add scraper

Por fim, precisaremos de alguma forma de lidar com os erros. Usamos thiserror para isso:

cargo add thiserror

As chamadas cargo add irĂŁo atualizar o arquivo Cargo.toml para ficar assim:

[package]
name = "link-checker"
version = "0.1.0"
edition = "2021"
publish = false

[dependencies]
reqwest = { version = "0.11.12", features = ["blocking", "rustls-tls"] }
scraper = "0.13.0"
thiserror = "1.0.37"

Agora vocĂȘ pode baixar a pĂĄgina inicial. Tente com um pequeno site como https://www.google.org/.

Seu arquivo src/main.rs deve se parecer com isto:

use reqwest::{blocking::Client, Url};
use scraper::{Html, Selector};
use thiserror::Error;

#[derive(Error, Debug)]
enum Error {
    #[error("request error: {0}")]
    ReqwestError(#[from] reqwest::Error),
    #[error("bad http response: {0}")]
    BadResponse(String),
}

#[derive(Debug)]
struct CrawlCommand {
    url: Url,
    extract_links: bool,
}

fn visit_page(client: &Client, command: &CrawlCommand) -> Result<Vec<Url>, Error> {
    println!("Checking {:#}", command.url);
    let response = client.get(command.url.clone()).send()?;
    if !response.status().is_success() {
        return Err(Error::BadResponse(response.status().to_string()));
    }

    let mut link_urls = Vec::new();
    if !command.extract_links {
        return Ok(link_urls);
    }

    let base_url = response.url().to_owned();
    let body_text = response.text()?;
    let document = Html::parse_document(&body_text);

    let selector = Selector::parse("a").unwrap();
    let href_values = document
        .select(&selector)
        .filter_map(|element| element.value().attr("href"));
    for href in href_values {
        match base_url.join(href) {
            Ok(link_url) => {
                link_urls.push(link_url);
            }
            Err(err) => {
                println!("On {base_url:#}: ignored unparsable {href:?}: {err}");
            }
        }
    }
    Ok(link_urls)
}

fn main() {
    let client = Client::new();
    let start_url = Url::parse("https://www.google.org").unwrap();
    let crawl_command = CrawlCommand{ url: start_url, extract_links: true };
    match visit_page(&client, &crawl_command) {
        Ok(links) => println!("Links: {links:#?}"),
        Err(err) => println!("Could not extract links: {err:#}"),
    }
}

Execute o cĂłdigo em src/main.rs com

cargo run

Tarefas

  • Use threads para verificar os links em paralelo: envie as URLs a serem verificadas para um channel e deixe alguns threads verificarem as URLs em paralelo.
  • Estenda isso para extrair recursivamente links de todas as pĂĄginas no domĂ­nio www.google.org. Coloque um limite mĂĄximo de 100 pĂĄginas ou menos para que vocĂȘ nĂŁo acabe sendo bloqueado pelo site.

Async Rust

“Async” is a concurrency model where multiple tasks are executed concurrently by executing each task until it would block, then switching to another task that is ready to make progress. The model allows running a larger number of tasks on a limited number of threads. This is because the per-task overhead is typically very low and operating systems provide primitives for efficiently identifying I/O that is able to proceed.

Rust’s asynchronous operation is based on “futures”, which represent work that may be completed in the future. Futures are “polled” until they signal that they are complete.

Futures are polled by an async runtime, and several different runtimes are available.

Comparisons

  • Python has a similar model in its asyncio. However, its Future type is callback-based, and not polled. Async Python programs require a “loop”, similar to a runtime in Rust.

  • JavaScript’s Promise is similar, but again callback-based. The language runtime implements the event loop, so many of the details of Promise resolution are hidden.

async/await

At a high level, async Rust code looks very much like “normal” sequential code:

use futures::executor::block_on;

async fn count_to(count: i32) {
    for i in 1..=count {
        println!("Count is: {i}!");
    }
}

async fn async_main(count: i32) {
    count_to(count).await;
}

fn main() {
    block_on(async_main(10));
}

Pontos chave:

  • Note that this is a simplified example to show the syntax. There is no long running operation or any real concurrency in it!

  • What is the return type of an async call?

    • Use let future: () = async_main(10); in main to see the type.
  • The “async” keyword is syntactic sugar. The compiler replaces the return type with a future.

  • You cannot make main async, without additional instructions to the compiler on how to use the returned future.

  • You need an executor to run async code. block_on blocks the current thread until the provided future has run to completion.

  • .await asynchronously waits for the completion of another operation. Unlike block_on, .await doesn’t block the current thread.

  • .await can only be used inside an async function (or block; these are introduced later).

Closures

Future is a trait, implemented by objects that represent an operation that may not be complete yet. A future can be polled, and poll returns a Poll.

#![allow(unused)]
fn main() {
use std::pin::Pin;
use std::task::Context;

pub trait Future {
    type Output;
    fn poll(self: Pin<&mut Self>, cx: &mut Context<'_>) -> Poll<Self::Output>;
}

pub enum Poll<T> {
    Ready(T),
    Pending,
}
}

An async function returns an impl Future. It’s also possible (but uncommon) to implement Future for your own types. For example, the JoinHandle returned from tokio::spawn implements Future to allow joining to it.

The .await keyword, applied to a Future, causes the current async function to pause until that Future is ready, and then evaluates to its output.

  • The Future and Poll types are implemented exactly as shown; click the links to show the implementations in the docs.

  • We will not get to Pin and Context, as we will focus on writing async code, rather than building new async primitives. Briefly:

    • Context allows a Future to schedule itself to be polled again when an event occurs.

    • Pin ensures that the Future isn’t moved in memory, so that pointers into that future remain valid. This is required to allow references to remain valid after an .await.

Tempos de Execução

A runtime provides support for performing operations asynchronously (a reactor) and is responsible for executing futures (an executor). Rust does not have a “built-in” runtime, but several options are available:

  • Tokio: performant, with a well-developed ecosystem of functionality like Hyper for HTTP or Tonic for gRPC.
  • async-std: aims to be a “std for async”, and includes a basic runtime in async::task.
  • smol: simple and lightweight

Several larger applications have their own runtimes. For example, Fuchsia already has one.

  • Note that of the listed runtimes, only Tokio is supported in the Rust playground. The playground also does not permit any I/O, so most interesting async things can’t run in the playground.

  • Futures are “inert” in that they do not do anything (not even start an I/O operation) unless there is an executor polling them. This differs from JS Promises, for example, which will run to completion even if they are never used.

Tokio

Tokio provides:

  • A multi-threaded runtime for executing asynchronous code.
  • An asynchronous version of the standard library.
  • A large ecosystem of libraries.
use tokio::time;

async fn count_to(count: i32) {
    for i in 1..=count {
        println!("Count in task: {i}!");
        time::sleep(time::Duration::from_millis(5)).await;
    }
}

#[tokio::main]
async fn main() {
    tokio::spawn(count_to(10));

    for i in 1..5 {
        println!("Main task: {i}");
        time::sleep(time::Duration::from_millis(5)).await;
    }
}
  • With the tokio::main macro we can now make main async.

  • The spawn function creates a new, concurrent “task”.

  • Note: spawn takes a Future, you don’t call .await on count_to.

Further exploration:

  • Why does count_to not (usually) get to 10? This is an example of async cancellation. tokio::spawn returns a handle which can be awaited to wait until it finishes.

  • Try count_to(10).await instead of spawning.

  • Try awaiting the task returned from tokio::spawn.

Tarefas

Rust has a task system, which is a form of lightweight threading.

A task has a single top-level future which the executor polls to make progress. That future may have one or more nested futures that its poll method polls, corresponding loosely to a call stack. Concurrency within a task is possible by polling multiple child futures, such as racing a timer and an I/O operation.

use tokio::io::{self, AsyncReadExt, AsyncWriteExt};
use tokio::net::TcpListener;

#[tokio::main]
async fn main() -> io::Result<()> {
    let listener = TcpListener::bind("127.0.0.1:6142").await?;
	println!("listening on port 6142");

    loop {
        let (mut socket, addr) = listener.accept().await?;

        println!("connection from {addr:?}");

        tokio::spawn(async move {
            if let Err(e) = socket.write_all(b"Who are you?\n").await {
                println!("socket error: {e:?}");
                return;
            }

            let mut buf = vec![0; 1024];
            let reply = match socket.read(&mut buf).await {
                Ok(n) => {
                    let name = std::str::from_utf8(&buf[..n]).unwrap().trim();
                    format!("Thanks for dialing in, {name}!\n")
                }
                Err(e) => {
                    println!("socket error: {e:?}");
                    return;
                }
            };

            if let Err(e) = socket.write_all(reply.as_bytes()).await {
                println!("socket error: {e:?}");
            }
        });
    }
}

Copy this example into your prepared src/main.rs and run it from there.

  • Ask students to visualize what the state of the example server would be with a few connected clients. What tasks exist? What are their Futures?

  • This is the first time we’ve seen an async block. This is similar to a closure, but does not take any arguments. Its return value is a Future, similar to an async fn.

  • Refactor the async block into a function, and improve the error handling using ?.

Canais AssĂ­ncronos

Several crates have support for asynchronous channels. For instance tokio:

use tokio::sync::mpsc::{self, Receiver};

async fn ping_handler(mut input: Receiver<()>) {
    let mut count: usize = 0;

    while let Some(_) = input.recv().await {
        count += 1;
        println!("Received {count} pings so far.");
    }

    println!("ping_handler complete");
}

#[tokio::main]
async fn main() {
    let (sender, receiver) = mpsc::channel(32);
    let ping_handler_task = tokio::spawn(ping_handler(receiver));
    for i in 0..10 {
        sender.send(()).await.expect("Failed to send ping.");
        println!("Sent {} pings so far.", i + 1);
    }

    drop(sender);
    ping_handler_task.await.expect("Something went wrong in ping handler task.");
}
  • Change the channel size to 3 and see how it affects the execution.

  • Overall, the interface is similar to the sync channels as seen in the morning class.

  • Try removing the std::mem::drop call. What happens? Why?

  • The Flume crate has channels that implement both sync and async send and recv. This can be convenient for complex applications with both IO and heavy CPU processing tasks.

  • What makes working with async channels preferable is the ability to combine them with other futures to combine them and create complex control flow.

Futures Control Flow

Futures can be combined together to produce concurrent compute flow graphs. We have already seen tasks, that function as independent threads of execution.

Join

A join operation waits until all of a set of futures are ready, and returns a collection of their results. This is similar to Promise.all in JavaScript or asyncio.gather in Python.

use anyhow::Result;
use futures::future;
use reqwest;
use std::collections::HashMap;

async fn size_of_page(url: &str) -> Result<usize> {
    let resp = reqwest::get(url).await?;
    Ok(resp.text().await?.len())
}

#[tokio::main]
async fn main() {
    let urls: [&str; 4] = [
        "https://google.com",
        "https://httpbin.org/ip",
        "https://play.rust-lang.org/",
        "BAD_URL",
    ];
    let futures_iter = urls.into_iter().map(size_of_page);
    let results = future::join_all(futures_iter).await;
    let page_sizes_dict: HashMap<&str, Result<usize>> =
        urls.into_iter().zip(results.into_iter()).collect();
    println!("{:?}", page_sizes_dict);
}

Copy this example into your prepared src/main.rs and run it from there.

  • For multiple futures of disjoint types, you can use std::future::join! but you must know how many futures you will have at compile time. This is currently in the futures crate, soon to be stabilised in std::future.

  • The risk of join is that one of the futures may never resolve, this would cause your program to stall.

  • You can also combine join_all with join! for instance to join all requests to an http service as well as a database query. Try adding a tokio::time::sleep to the future, using futures::join!. This is not a timeout (that requires select!, explained in the next chapter), but demonstrates join!.

Select

A select operation waits until any of a set of futures is ready, and responds to that future’s result. In JavaScript, this is similar to Promise.race. In Python, it compares to asyncio.wait(task_set, return_when=asyncio.FIRST_COMPLETED).

Similar to a match statement, the body of select! has a number of arms, each of the form pattern = future => statement. When the future is ready, the statement is executed with the variables in pattern bound to the future’s result.

use tokio::sync::mpsc::{self, Receiver};
use tokio::time::{sleep, Duration};

#[derive(Debug, PartialEq)]
enum Animal {
    Cat { name: String },
    Dog { name: String },
}

async fn first_animal_to_finish_race(
    mut cat_rcv: Receiver<String>,
    mut dog_rcv: Receiver<String>,
) -> Option<Animal> {
    tokio::select! {
        cat_name = cat_rcv.recv() => Some(Animal::Cat { name: cat_name? }),
        dog_name = dog_rcv.recv() => Some(Animal::Dog { name: dog_name? })
    }
}

#[tokio::main]
async fn main() {
    let (cat_sender, cat_receiver) = mpsc::channel(32);
    let (dog_sender, dog_receiver) = mpsc::channel(32);
    tokio::spawn(async move {
        sleep(Duration::from_millis(500)).await;
        cat_sender
            .send(String::from("Felix"))
            .await
            .expect("Failed to send cat.");
    });
    tokio::spawn(async move {
        sleep(Duration::from_millis(50)).await;
        dog_sender
            .send(String::from("Rex"))
            .await
            .expect("Failed to send dog.");
    });

    let winner = first_animal_to_finish_race(cat_receiver, dog_receiver)
        .await
        .expect("Failed to receive winner");

    println!("Winner is {winner:?}");
}
  • In this example, we have a race between a cat and a dog. first_animal_to_finish_race listens to both channels and will pick whichever arrives first. Since the dog takes 50ms, it wins against the cat that take 500ms seconds.

  • You can use oneshot channels in this example as the channels are supposed to receive only one send.

  • Try adding a deadline to the race, demonstrating selecting different sorts of futures.

  • Note that select! drops unmatched branches, which cancels their futures. It is easiest to use when every execution of select! creates new futures.

    • An alternative is to pass &mut future instead of the future itself, but this can lead to issues, further discussed in the pinning slide.

Pitfalls of async/await

Async / await provides convenient and efficient abstraction for concurrent asynchronous programming. However, the async/await model in Rust also comes with its share of pitfalls and footguns. We illustrate some of them in this chapter:

Blocking the executor

Most async runtimes only allow IO tasks to run concurrently. This means that CPU blocking tasks will block the executor and prevent other tasks from being executed. An easy workaround is to use async equivalent methods where possible.

use futures::future::join_all;
use std::time::Instant;

async fn sleep_ms(start: &Instant, id: u64, duration_ms: u64) {
    std::thread::sleep(std::time::Duration::from_millis(duration_ms));
    println!(
        "future {id} slept for {duration_ms}ms, finished after {}ms",
        start.elapsed().as_millis()
    );
}

#[tokio::main(flavor = "current_thread")]
async fn main() {
    let start = Instant::now();
    let sleep_futures = (1..=10).map(|t| sleep_ms(&start, t, t * 10));
    join_all(sleep_futures).await;
}
  • Run the code and see that the sleeps happen consecutively rather than concurrently.

  • The "current_thread" flavor puts all tasks on a single thread. This makes the effect more obvious, but the bug is still present in the multi-threaded flavor.

  • Switch the std::thread::sleep to tokio::time::sleep and await its result.

  • Another fix would be to tokio::task::spawn_blocking which spawns an actual thread and transforms its handle into a future without blocking the executor.

  • You should not think of tasks as OS threads. They do not map 1 to 1 and most executors will allow many tasks to run on a single OS thread. This is particularly problematic when interacting with other libraries via FFI, where that library might depend on thread-local storage or map to specific OS threads (e.g., CUDA). Prefer tokio::task::spawn_blocking in such situations.

  • Use sync mutexes with care. Holding a mutex over an .await may cause another task to block, and that task may be running on the same thread.

Pin

When you await a future, all local variables (that would ordinarily be stored on a stack frame) are instead stored in the Future for the current async block. If your future has pointers to data on the stack, those pointers might get invalidated. This is unsafe.

Therefore, you must guarantee that the addresses your future points to don’t change. That is why we need to pin futures. Using the same future repeatedly in a select! often leads to issues with pinned values.

use tokio::sync::{mpsc, oneshot};
use tokio::task::spawn;
use tokio::time::{sleep, Duration};

// A work item. In this case, just sleep for the given time and respond
// with a message on the `respond_on` channel.
#[derive(Debug)]
struct Work {
    input: u32,
    respond_on: oneshot::Sender<u32>,
}

// A worker which listens for work on a queue and performs it.
async fn worker(mut work_queue: mpsc::Receiver<Work>) {
    let mut iterations = 0;
    loop {
        tokio::select! {
            Some(work) = work_queue.recv() => {
                sleep(Duration::from_millis(10)).await; // Pretend to work.
                work.respond_on
                    .send(work.input * 1000)
                    .expect("failed to send response");
                iterations += 1;
            }
            // TODO: report number of iterations every 100ms
        }
    }
}

// A requester which requests work and waits for it to complete.
async fn do_work(work_queue: &mpsc::Sender<Work>, input: u32) -> u32 {
    let (tx, rx) = oneshot::channel();
    work_queue
        .send(Work {
            input,
            respond_on: tx,
        })
        .await
        .expect("failed to send on work queue");
    rx.await.expect("failed waiting for response")
}

#[tokio::main]
async fn main() {
    let (tx, rx) = mpsc::channel(10);
    spawn(worker(rx));
    for i in 0..100 {
        let resp = do_work(&tx, i).await;
        println!("work result for iteration {i}: {resp}");
    }
}
  • You may recognize this as an example of the actor pattern. Actors typically call select! in a loop.

  • This serves as a summation of a few of the previous lessons, so take your time with it.

    • Naively add a _ = sleep(Duration::from_millis(100)) => { println!(..) } to the select!. This will never execute. Why?

    • Instead, add a timeout_fut containing that future outside of the loop:

      #![allow(unused)]
      fn main() {
      let mut timeout_fut = sleep(Duration::from_millis(100));
      loop {
          select! {
              ..,
              _ = timeout_fut => { println!(..); },
          }
      }
      }
    • This still doesn’t work. Follow the compiler errors, adding &mut to the timeout_fut in the select! to work around the move, then using Box::pin:

      #![allow(unused)]
      fn main() {
      let mut timeout_fut = Box::pin(sleep(Duration::from_millis(100)));
      loop {
          select! {
              ..,
              _ = &mut timeout_fut => { println!(..); },
          }
      }
      }
    • This compiles, but once the timeout expires it is Poll::Ready on every iteration (a fused future would help with this). Update to reset timeout_fut every time it expires.

  • Box allocates on the heap. In some cases, std::pin::pin! (only recently stabilized, with older code often using tokio::pin!) is also an option, but that is difficult to use for a future that is reassigned.

  • Another alternative is to not use pin at all but spawn another task that will send to a oneshot channel every 100ms.

Traits (CaracterĂ­sticas)

Async methods in traits are not yet supported in the stable channel (An experimental feature exists in nightly and should be stabilized in the mid term.)

The crate async_trait provides a workaround through a macro:

use async_trait::async_trait;
use std::time::Instant;
use tokio::time::{sleep, Duration};

#[async_trait]
trait Sleeper {
    async fn sleep(&self);
}

struct FixedSleeper {
    sleep_ms: u64,
}

#[async_trait]
impl Sleeper for FixedSleeper {
    async fn sleep(&self) {
        sleep(Duration::from_millis(self.sleep_ms)).await;
    }
}

async fn run_all_sleepers_multiple_times(sleepers: Vec<Box<dyn Sleeper>>, n_times: usize) {
    for _ in 0..n_times {
        println!("running all sleepers..");
        for sleeper in &sleepers {
            let start = Instant::now();
            sleeper.sleep().await;
            println!("slept for {}ms", start.elapsed().as_millis());
        }
    }
}

#[tokio::main]
async fn main() {
    let sleepers: Vec<Box<dyn Sleeper>> = vec![
        Box::new(FixedSleeper { sleep_ms: 50 }),
        Box::new(FixedSleeper { sleep_ms: 100 }),
    ];
    run_all_sleepers_multiple_times(sleepers, 5).await;
}
  • async_trait is easy to use, but note that it’s using heap allocations to achieve this. This heap allocation has performance overhead.

  • The challenges in language support for async trait are deep Rust and probably not worth describing in-depth. Niko Matsakis did a good job of explaining them in this post if you are interested in digging deeper.

  • Try creating a new sleeper struct that will sleep for a random amount of time and adding it to the Vec.

Cancelar

Dropping a future implies it can never be polled again. This is called cancellation and it can occur at any await point. Care is needed to ensure the system works correctly even when futures are cancelled. For example, it shouldn’t deadlock or lose data.

use std::io::{self, ErrorKind};
use std::time::Duration;
use tokio::io::{AsyncReadExt, AsyncWriteExt, DuplexStream};

struct LinesReader {
    stream: DuplexStream,
}

impl LinesReader {
    fn new(stream: DuplexStream) -> Self {
        Self { stream }
    }

    async fn next(&mut self) -> io::Result<Option<String>> {
        let mut bytes = Vec::new();
        let mut buf = [0];
        while self.stream.read(&mut buf[..]).await? != 0 {
            bytes.push(buf[0]);
            if buf[0] == b'\n' {
                break;
            }
        }
        if bytes.is_empty() {
            return Ok(None)
        }
        let s = String::from_utf8(bytes)
            .map_err(|_| io::Error::new(ErrorKind::InvalidData, "not UTF-8"))?;
        Ok(Some(s))
    }
}

async fn slow_copy(source: String, mut dest: DuplexStream) -> std::io::Result<()> {
    for b in source.bytes() {
        dest.write_u8(b).await?;
        tokio::time::sleep(Duration::from_millis(10)).await
    }
    Ok(())
}

#[tokio::main]
async fn main() -> std::io::Result<()> {
    let (client, server) = tokio::io::duplex(5);
    let handle = tokio::spawn(slow_copy("hi\nthere\n".to_owned(), client));

    let mut lines = LinesReader::new(server);
    let mut interval = tokio::time::interval(Duration::from_millis(60));
    loop {
        tokio::select! {
            _ = interval.tick() => println!("tick!"),
            line = lines.next() => if let Some(l) = line? {
                print!("{}", l)
            } else {
                break
            },
        }
    }
    handle.await.unwrap()?;
    Ok(())
}
  • The compiler doesn’t help with cancellation-safety. You need to read API documentation and consider what state your async fn holds.

  • Unlike panic and ?, cancellation is part of normal control flow (vs error-handling).

  • The example loses parts of the string.

    • Whenever the tick() branch finishes first, next() and its buf are dropped.

    • LinesReader can be made cancellation-safe by makeing buf part of the struct:

      #![allow(unused)]
      fn main() {
      struct LinesReader {
          stream: DuplexStream,
          bytes: Vec<u8>,
          buf: [u8; 1],
      }
      
      impl LinesReader {
          fn new(stream: DuplexStream) -> Self {
              Self { stream, bytes: Vec::new(), buf: [0] }
          }
          async fn next(&mut self) -> io::Result<Option<String>> {
              // prefix buf and bytes with self.
              // 

              let raw = std::mem::take(&mut self.bytes);
              let s = String::from_utf8(raw)
              // 

          }
      }
      }
  • Interval::tick is cancellation-safe because it keeps track of whether a tick has been ‘delivered’.

  • AsyncReadExt::read is cancellation-safe because it either returns or doesn’t read data.

  • AsyncBufReadExt::read_line is similar to the example and isn’t cancellation-safe. See its documentation for details and alternatives.

ExercĂ­cios

To practice your Async Rust skills, we have again two exercises for you:

  • Dining philosophers: we already saw this problem in the morning. This time you are going to implement it with Async Rust.

  • A Broadcast Chat Application: this is a larger project that allows you experiment with more advanced Async Rust features.

Depois de ver os exercĂ­cios, vocĂȘ pode ver as soluçÔes fornecidas.

Dining Philosophers - Async

See dining philosophers for a description of the problem.

As before, you will need a local Cargo installation for this exercise. Copy the code below to a file called src/main.rs, fill out the blanks, and test that cargo run does not deadlock:

use std::sync::Arc;
use tokio::time;
use tokio::sync::mpsc::{self, Sender};
use tokio::sync::Mutex;

struct Fork;

struct Philosopher {
    name: String,
    // left_fork: ...
    // right_fork: ...
    // thoughts: ...
}

impl Philosopher {
    async fn think(&self) {
        self.thoughts
            .send(format!("Eureka! {} has a new idea!", &self.name)).await
            .unwrap();
    }

    async fn eat(&self) {
        // Pick up forks...
        println!("{} is eating...", &self.name);
        time::sleep(time::Duration::from_millis(5)).await;
    }
}

static PHILOSOPHERS: &[&str] =
    &["Socrates", "Plato", "Aristotle", "Thales", "Pythagoras"];

#[tokio::main]
async fn main() {
    // Create forks

    // Create philosophers

    // Make them think and eat

    // Output their thoughts
}

Since this time you are using Async Rust, you’ll need a tokio dependency. You can use the following Cargo.toml:

[package]
name = "dining-philosophers-async-dine"
version = "0.1.0"
edition = "2021"

[dependencies]
tokio = {version = "1.26.0", features = ["sync", "time", "macros", "rt-multi-thread"]}

Also note that this time you have to use the Mutex and the mpsc module from the tokio crate.

  • Can you make your implementation single-threaded?

Broadcast Chat Application

In this exercise, we want to use our new knowledge to implement a broadcast chat application. We have a chat server that the clients connect to and publish their messages. The client reads user messages from the standard input, and sends them to the server. The chat server broadcasts each message that it receives to all the clients.

For this, we use a broadcast channel on the server, and tokio_websockets for the communication between the client and the server.

Create a new Cargo project and add the following dependencies:

Cargo.toml:

[package]
name = "chat-async"
version = "0.1.0"
edition = "2021"

[dependencies]
futures-util = "0.3.28"
http = "0.2.9"
tokio = { version = "1.28.1", features = ["full"] }
tokio-websockets = "0.3.2"

The required APIs

You are going to need the following functions from tokio and tokio_websockets. Spend a few minutes to familiarize yourself with the API.

Two binaries

Normally in a Cargo project, you can have only one binary, and one src/main.rs file. In this project, we need two binaries. One for the client, and one for the server. You could potentially make them two separate Cargo projects, but we are going to put them in a single Cargo project with two binaries. For this to work, the client and the server code should go under src/bin (see the documentation).

Copy the following server and client code into src/bin/server.rs and src/bin/client.rs, respectively. Your task is to complete these files as described below.

src/bin/server.rs:

use futures_util::sink::SinkExt;
use std::error::Error;
use std::net::SocketAddr;
use tokio::net::{TcpListener, TcpStream};
use tokio::sync::broadcast::{channel, Sender};
use tokio_websockets::{Message, ServerBuilder, WebsocketStream};

async fn handle_connection(
    addr: SocketAddr,
    mut ws_stream: WebsocketStream<TcpStream>,
    bcast_tx: Sender<String>,
) -> Result<(), Box<dyn Error + Send + Sync>> {

    // TODO: For a hint, see the description of the task below.

}

#[tokio::main]
async fn main() -> Result<(), Box<dyn Error + Send + Sync>> {
    let (bcast_tx, _) = channel(16);

    let listener = TcpListener::bind("127.0.0.1:2000").await?;
    println!("listening on port 2000");

    loop {
        let (socket, addr) = listener.accept().await?;
        println!("New connection from {addr:?}");
        let bcast_tx = bcast_tx.clone();
        tokio::spawn(async move {
            // Wrap the raw TCP stream into a websocket.
            let ws_stream = ServerBuilder::new().accept(socket).await?;

            handle_connection(addr, ws_stream, bcast_tx).await
        });
    }
}

src/bin/client.rs:

use futures_util::SinkExt;
use http::Uri;
use tokio::io::{AsyncBufReadExt, BufReader};
use tokio_websockets::{ClientBuilder, Message};

#[tokio::main]
async fn main() -> Result<(), tokio_websockets::Error> {
    let mut ws_stream = ClientBuilder::from_uri(Uri::from_static("ws://127.0.0.1:2000"))
        .connect()
        .await?;

    let stdin = tokio::io::stdin();
    let mut stdin = BufReader::new(stdin).lines();


    // TODO: For a hint, see the description of the task below.

}

Running the binaries

Run the server with:

cargo run --bin server

and the client with:

cargo run --bin client

Tarefas

  • Implement the handle_connection function in src/bin/server.rs.
    • Hint: Use tokio::select! for concurrently performing two tasks in a continuous loop. One task receives messages from the client and broadcasts them. The other sends messages received by the server to the client.
  • Complete the main function in src/bin/client.rs.
    • Hint: As before, use tokio::select! in a continuous loop for concurrently performing two tasks: (1) reading user messages from standard input and sending them to the server, and (2) receiving messages from the server, and displaying them for the user.
  • Optional: Once you are done, change the code to broadcast messages to all clients, but the sender of the message.

Obrigado!

Obrigado por fazer o Comprehensive Rust 🩀! Esperamos que tenha gostado e que tenha sido Ăștil.

NĂłs nos divertimos muito montando o curso. O curso nĂŁo Ă© perfeito, portanto, se vocĂȘ identificou algum erro ou tem ideias para melhorias, entre em entre em contato conosco em GitHub. NĂłs adorarĂ­amos ouvir vocĂȘ.

Outros recursos de Rust

A comunidade Rust tem abundĂąncia de recursos gratuitos e de alta qualidade on-line.

Documentação Oficial

O projeto Rust hospeda muitos recursos. Estes cobrem Rust em geral:

  • A Linguagem de Programação Rust: o livro gratuito canĂŽnico sobre Rust. Abrange o idioma em detalhes e inclui alguns projetos para as pessoas construĂ­rem.
  • Rust By Example: abrange a sintaxe de Rust por meio de uma sĂ©rie de exemplos que mostram diferentes construçÔes. As vezes inclui pequenos exercĂ­cios onde vocĂȘ Ă© solicitado a expandir o cĂłdigo dos exemplos.
  • Rust Standard Library: documentação completa da biblioteca padrĂŁo para Rust.
  • The Rust Reference: um livro incompleto que descreve a gramĂĄtica Rust e o modelo de memĂłria.

Mais guias especializados hospedados no site oficial do Rust:

  • O Rustonomicon: cobre Rust inseguro, incluindo trabalhar com ponteiros brutos e fazer interface com outras linguagens (FFI).
  • Programação assĂ­ncrona em Rust: abrange o novo modelo de programação assĂ­ncrona que foi introduzido apĂłs o Rust Book ser escrito.
  • The Embedded Rust Book: uma introdução ao uso do Rust em dispositivos embarcados sem um sistema operacional.

Material de aprendizagem nĂŁo oficial

Uma pequena seleção de outros guias e tutoriais para Rust:

Consulte o Little Book of Rust Books para ainda mais livros Rust.

Créditos

O material aqui se baseia em muitas fontes excelentes de documentação do Rust. Consulte a pĂĄgina em outros recursos para obter uma lista completa de recursos Ășteis .

The material of Comprehensive Rust is licensed under the terms of the Apache 2.0 license, please see LICENSE for details.

Rust by Example

Alguns exemplos e exercícios foram copiados e adaptados de Rust by Exemplo. por favor veja o diretório third_party/rust-by-example/ para detalhes, incluindo os termos de licença.

Rust on Exercism

Alguns exercícios foram copiados e adaptados de Rust on Exercism. por favor veja o diretório third_party/rust-on-exercism/ para obter detalhes, incluindo os termos licença.

CXX

A seção Interoperability with C++ usa uma imagem de CXX. Consulte o diretório third_party/cxx/ para obter detalhes, incluindo os termos da licença.

SoluçÔes

VocĂȘ encontrarĂĄ soluçÔes para os exercĂ­cios nas pĂĄginas seguintes.

Sinta-se Ă  vontade para fazer perguntas sobre as soluçÔes no GitHub. Nos informe se vocĂȘ tiver uma solução diferente ou melhor do que a apresentada aqui.

Nota: Ignore os comentĂĄrios // ANCHOR: label e // ANCHOR_END: label que vocĂȘ vĂȘ nas soluçÔes. Eles estĂŁo lĂĄ para tornar possĂ­vel reutilizar partes das soluçÔes como exercĂ­cios.

Dia 1 ExercĂ­cios matinais

Matrizes (Arrays) e Loops (Laços) for

(voltar ao exercĂ­cio)

// Copyright 2022 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

// ANCHOR: transpose
fn transpose(matrix: [[i32; 3]; 3]) -> [[i32; 3]; 3] {
    // ANCHOR_END: transpose
    let mut result = [[0; 3]; 3];
    for i in 0..3 {
        for j in 0..3 {
            result[j][i] = matrix[i][j];
        }
    }
    return result;
}

// ANCHOR: pretty_print
fn pretty_print(matrix: &[[i32; 3]; 3]) {
    // ANCHOR_END: pretty_print
    for row in matrix {
        println!("{row:?}");
    }
}

// ANCHOR: tests
#[test]
fn test_transpose() {
    let matrix = [
        [101, 102, 103], //
        [201, 202, 203],
        [301, 302, 303],
    ];
    let transposed = transpose(matrix);
    assert_eq!(
        transposed,
        [
            [101, 201, 301], //
            [102, 202, 302],
            [103, 203, 303],
        ]
    );
}
// ANCHOR_END: tests

// ANCHOR: main
fn main() {
    let matrix = [
        [101, 102, 103], // <-- o comentĂĄrio faz com que o rustfmt adicione uma nova linha
        [201, 202, 203],
        [301, 302, 303],
    ];

    println!("matriz:");
    pretty_print(&matrix);

    let transposed = transpose(matrix);
    println!("transposta:");
    pretty_print(&transposed);
}

Bonus question

Isso necessita a utilização de conceitos mais avançados. Pode parecer que poderĂ­amos usar uma slice de slices (&[&[i32]]) como o tipo de entrada para transposta e, assim, fazer nossa função lidar com qualquer tamanho de matriz. No entanto, isso falha rapidamente: o tipo de retorno nĂŁo pode ser &[&[i32]], pois ele precisa possuir os dados que vocĂȘ retorna.

VocĂȘ pode tentar usar algo como Vec<Vec<i32>>, mas isso tambĂ©m nĂŁo funciona muito bem: Ă© difĂ­cil converter de Vec<Vec<i32>> para &[&[i32]] entĂŁo agora vocĂȘ tambĂ©m nĂŁo pode usar impressao_formatada facilmente.

Assim que chegarmos aos traits and generics, podemos usar o trait std::convert::AsRef para abstrair qualquer coisa que pode ser referenciada como um slice.

use std::convert::AsRef;
use std::fmt::Debug;

fn pretty_print<T, Line, Matrix>(matrix: Matrix)
where
    T: Debug,
    // A line references a slice of items
    Line: AsRef<[T]>,
    // A matrix references a slice of lines
    Matrix: AsRef<[Line]>
{
    for row in matrix.as_ref() {
        println!("{:?}", row.as_ref());
    }
}

fn main() {
    // &[&[i32]]
    pretty_print(&[&[1, 2, 3], &[4, 5, 6], &[7, 8, 9]]);
    // [[&str; 2]; 2]
    pretty_print([["a", "b"], ["c", "d"]]);
    // Vec<Vec<i32>>
    pretty_print(vec![vec![1, 2], vec![3, 4]]);
}

Além disso, o próprio tipo não imporia que as slices filhas tenham o mesmo comprimento, portanto, tal variåvel poderia conter uma matriz invålida.

Dia 1 ExercĂ­cios da Tarde

Algoritmo de Luhn

(voltar ao exercĂ­cio)

// Copyright 2022 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

// ANCHOR: luhn
pub fn luhn(cc_number: &str) -> bool {
    // ANCHOR_END: luhn
    let mut digits_seen = 0;
    let mut sum = 0;
    for (i, ch) in cc_number.chars().rev().filter(|&ch| ch != ' ').enumerate() {
        match ch.to_digit(10) {
            Some(d) => {
                sum += if i % 2 == 1 {
                    let dd = d * 2;
                    dd / 10 + dd % 10
                } else {
                    d
                };
                digits_seen += 1;
            }
            None => return false,
        }
    }

    if digits_seen < 2 {
        return false;
    }

    sum % 10 == 0
}

fn main() {
    let cc_number = "1234 5678 1234 5670";
    println!(
        "Is {cc_number} a valid credit card number? {}",
        if luhn(cc_number) { "sim" } else { "nĂŁo" }
    );
}

// ANCHOR: unit-tests
#[test]
fn test_non_digit_cc_number() {
    assert!(!luhn("foo"));
}

#[test]
fn test_empty_cc_number() {
    assert!(!luhn(""));
    assert!(!luhn(" "));
    assert!(!luhn("  "));
    assert!(!luhn("    "));
}

#[test]
fn test_single_digit_cc_number() {
    assert!(!luhn("0"));
}

#[test]
fn test_two_digit_cc_number() {
    assert!(luhn(" 0 0 "));
}

#[test]
fn test_valid_cc_number() {
    assert!(luhn("4263 9826 4026 9299"));
    assert!(luhn("4539 3195 0343 6467"));
    assert!(luhn("7992 7398 713"));
}

#[test]
fn test_invalid_cc_number() {
    assert!(!luhn("4223 9826 4026 9299"));
    assert!(!luhn("4539 3195 0343 6476"));
    assert!(!luhn("8273 1232 7352 0569"));
}
// ANCHOR_END: unit-tests

Pattern matching

TBD.

Dia 2 ExercĂ­cios matinais

Projetando uma biblioteca

(voltar ao exercĂ­cio)

// Copyright 2022 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

// ANCHOR: setup
struct Library {
    books: Vec<Book>,
}

struct Book {
    title: String,
    year: u16,
}

impl Book {
    // Este Ă© um construtor, utilizado abaixo.
    fn new(title: &str, year: u16) -> Book {
        Book {
            title: String::from(title),
            year,
        }
    }
}

// Implemente os métodos abaixo. Atualize o parùmetro `self` para
// indicar o nĂ­vel requerido de ownership sobre o objeto:
//
// - `&self` para acesso compartilhado de apenas leitura,
// - `&mut self` para acesso mutĂĄvel exclusivo,
// - `self` para acesso exclusivo por valor.
impl Library {
    // ANCHOR_END: setup

    // ANCHOR: Library_new
    fn new() -> Library {
        // ANCHOR_END: Library_new
        Library { books: Vec::new() }
    }

    // ANCHOR: Library_len
    //fn len(self) -> usize {
    //    todo!("Return the length of `self.books`")
    //}
    // ANCHOR_END: Library_len
    fn len(&self) -> usize {
        self.books.len()
    }

    // ANCHOR: Library_is_empty
    //fn is_empty(self) -> bool {
    //    todo!("Return `true` if `self.books` is empty")
    //}
    // ANCHOR_END: Library_is_empty
    fn is_empty(&self) -> bool {
        self.books.is_empty()
    }

    // ANCHOR: Library_add_book
    //fn add_book(self, book: Book) {
    //    todo!("Add a new book to `self.books`")
    //}
    // ANCHOR_END: Library_add_book
    fn add_book(&mut self, book: Book) {
        self.books.push(book)
    }

    // ANCHOR: Library_print_books
    //fn print_books(self) {
    //    todo!("Iterate over `self.books` and each book's title and year")
    //}
    // ANCHOR_END: Library_print_books
    fn print_books(&self) {
        for book in &self.books {
            println!("{}, published in {}", book.title, book.year);
        }
    }

    // ANCHOR: Library_oldest_book
    //fn oldest_book(self) -> Option<&Book> {
    //    todo!("Return a reference to the oldest book (if any)")
    //}
    // ANCHOR_END: Library_oldest_book
    fn oldest_book(&self) -> Option<&Book> {
        // Using a closure and a built-in method:
        // self.books.iter().min_by_key(|book| book.year)

        // Longer hand-written solution:
        let mut oldest: Option<&Book> = None;
        for book in self.books.iter() {
            if oldest.is_none() || book.year < oldest.unwrap().year {
                oldest = Some(book);
            }
        }

        oldest
    }
}

// ANCHOR: main
// This shows the desired behavior. Uncomment the code below and
// implement the missing methods. You will need to update the
// method signatures, including the "self" parameter! You may
// also need to update the variable bindings within main.
fn main() {
    let library = Library::new();

    //println!("A biblioteca estĂĄ vazia: biblioteca.esta_vazia() -> {}", biblioteca.esta_vazia());
    //
    //biblioteca.adicionar_livro(Livro::new("Lord of the Rings", 1954));
    //biblioteca.adicionar_livro(Livro::new("Alice's Adventures in Wonderland", 1865));
    //
    //println!("The biblioteca nĂŁo estĂĄ mais vazia: biblioteca.esta_vazia() -> {}", biblioteca.esta_vazia());
    //
    //
    //biblioteca.imprimir_livros();
    //
    //match biblioteca.livro_mais_antigo() {
    //    Some(livro) => println!("O livro mais antigo Ă© {}", livro.titulo),
    //    None => println!("A biblioteca estĂĄ vazia!"),
    //}
    //
    //println!("The biblioteca tem {} livros", biblioteca.tamanho());
    //biblioteca.imprimir_livros();
}
// ANCHOR_END: main

#[test]
fn test_library_len() {
    let mut library = Library::new();
    assert_eq!(library.len(), 0);
    assert!(library.is_empty());

    library.add_book(Book::new("Lord of the Rings", 1954));
    library.add_book(Book::new("Alice's Adventures in Wonderland", 1865));
    assert_eq!(library.len(), 2);
    assert!(!library.is_empty());
}

#[test]
fn test_library_is_empty() {
    let mut library = Library::new();
    assert!(library.is_empty());

    library.add_book(Book::new("Lord of the Rings", 1954));
    assert!(!library.is_empty());
}

#[test]
fn test_library_print_books() {
    let mut library = Library::new();
    library.add_book(Book::new("Lord of the Rings", 1954));
    library.add_book(Book::new("Alice's Adventures in Wonderland", 1865));
    // We could try and capture stdout, but let us just call the
    // method to start with.
    library.print_books();
}

#[test]
fn test_library_oldest_book() {
    let mut library = Library::new();
    assert!(library.oldest_book().is_none());

    library.add_book(Book::new("Lord of the Rings", 1954));
    assert_eq!(
        library.oldest_book().map(|b| b.title.as_str()),
        Some("Lord of the Rings")
    );

    library.add_book(Book::new("Alice's Adventures in Wonderland", 1865));
    assert_eq!(
        library.oldest_book().map(|b| b.title.as_str()),
        Some("Alice's Adventures in Wonderland")
    );
}

Dia 2 ExercĂ­cios da Tarde

Strings e Iteradores

(voltar ao exercĂ­cio)

// Copyright 2022 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

// ANCHOR: prefix_matches
pub fn prefix_matches(prefix: &str, request_path: &str) -> bool {
    // ANCHOR_END: prefix_matches

    let mut request_segments = request_path.split('/');

    for prefix_segment in prefix.split('/') {
        let Some(request_segment) = request_segments.next() else {
            return false;
        };
        if request_segment != prefix_segment && prefix_segment != "*" {
            return false;
        }
    }
    true

    // Alternatively, Iterator::zip() lets us iterate simultaneously over prefix
    // and request segments. The zip() iterator is finished as soon as one of
    // the source iterators is finished, but we need to iterate over all request
    // segments. A neat trick that makes zip() work is to use map() and chain()
    // to produce an iterator that returns Some(str) for each pattern segments,
    // and then returns None indefinitely.
}

// ANCHOR: unit-tests
#[test]
fn test_matches_without_wildcard() {
    assert!(prefix_matches("/v1/editores", "/v1/editores"));
    assert!(prefix_matches("/v1/editores", "/v1/editores/abc-123"));
    assert!(prefix_matches("/v1/editores", "/v1/editores/abc/livros"));

    assert!(!prefix_matches("/v1/editores", "/v1"));
    assert!(!prefix_matches("/v1/editores", "/v1/editoresLivros"));
    assert!(!prefix_matches("/v1/editores", "/v1/pai/editores"));
}

#[test]
fn test_matches_with_wildcard() {
    assert!(prefix_matches(
        "/v1/editores/*/livros",
        "/v1/editores/foo/livros"
    ));
    assert!(prefix_matches(
        "/v1/editores/*/livros",
        "/v1/editores/bar/livros"
    ));
    assert!(prefix_matches(
        "/v1/editores/*/livros",
        "/v1/editores/foo/livros/livro1"
    ));

    assert!(!prefix_matches("/v1/editores/*/livros", "/v1/editores"));
    assert!(!prefix_matches(
        "/v1/editores/*/livros",
        "/v1/editores/foo/livrosPorAutor"
    ));
}
// ANCHOR_END: unit-tests

fn main() {}

Dia 3 ExercĂ­cio matinal

Uma Biblioteca GUI Simples

(voltar ao exercĂ­cio)

// Copyright 2022 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

// ANCHOR: setup
pub trait Widget {
    /// Natural width of `self`.
    fn width(&self) -> usize;

    /// Draw the widget into a buffer.
    fn draw_into(&self, buffer: &mut dyn std::fmt::Write);

    /// Draw the widget on standard output.
    fn draw(&self) {
        let mut buffer = String::new();
        self.draw_into(&mut buffer);
        println!("{buffer}");
    }
}

pub struct Label {
    label: String,
}

impl Label {
    fn new(label: &str) -> Label {
        Label {
            label: label.to_owned(),
        }
    }
}

pub struct Button {
    label: Label,
    callback: Box<dyn FnMut()>,
}

impl Button {
    fn new(label: &str, callback: Box<dyn FnMut()>) -> Button {
        Button {
            label: Label::new(label),
            callback,
        }
    }
}

pub struct Window {
    title: String,
    widgets: Vec<Box<dyn Widget>>,
}

impl Window {
    fn new(title: &str) -> Window {
        Window {
            title: title.to_owned(),
            widgets: Vec::new(),
        }
    }

    fn add_widget(&mut self, widget: Box<dyn Widget>) {
        self.widgets.push(widget);
    }

    fn inner_width(&self) -> usize {
        std::cmp::max(
            self.title.chars().count(),
            self.widgets.iter().map(|w| w.width()).max().unwrap_or(0),
        )
    }
}

// ANCHOR_END: setup

// ANCHOR: Window-width
impl Widget for Window {
    fn width(&self) -> usize {
        // ANCHOR_END: Window-width
        // Add 4 paddings for borders
        self.inner_width() + 4
    }

    // ANCHOR: Window-draw_into
    fn draw_into(&self, buffer: &mut dyn std::fmt::Write) {
        // ANCHOR_END: Window-draw_into
        let mut inner = String::new();
        for widget in &self.widgets {
            widget.draw_into(&mut inner);
        }

        let inner_width = self.inner_width();

        // TODO: after learning about error handling, you can change
        // draw_into to return Result<(), std::fmt::Error>. Then use
        // the ?-operator here instead of .unwrap().
        writeln!(buffer, "+-{:-<inner_width$}-+", "").unwrap();
        writeln!(buffer, "| {:^inner_width$} |", &self.title).unwrap();
        writeln!(buffer, "+={:=<inner_width$}=+", "").unwrap();
        for line in inner.lines() {
            writeln!(buffer, "| {:inner_width$} |", line).unwrap();
        }
        writeln!(buffer, "+-{:-<inner_width$}-+", "").unwrap();
    }
}

// ANCHOR: Button-width
impl Widget for Button {
    fn width(&self) -> usize {
        // ANCHOR_END: Button-width
        self.label.width() + 8 // add a bit of padding
    }

    // ANCHOR: Button-draw_into
    fn draw_into(&self, buffer: &mut dyn std::fmt::Write) {
        // ANCHOR_END: Button-draw_into
        let width = self.width();
        let mut label = String::new();
        self.label.draw_into(&mut label);

        writeln!(buffer, "+{:-<width$}+", "").unwrap();
        for line in label.lines() {
            writeln!(buffer, "|{:^width$}|", &line).unwrap();
        }
        writeln!(buffer, "+{:-<width$}+", "").unwrap();
    }
}

// ANCHOR: Label-width
impl Widget for Label {
    fn width(&self) -> usize {
        // ANCHOR_END: Label-width
        self.label
            .lines()
            .map(|line| line.chars().count())
            .max()
            .unwrap_or(0)
    }

    // ANCHOR: Label-draw_into
    fn draw_into(&self, buffer: &mut dyn std::fmt::Write) {
        // ANCHOR_END: Label-draw_into
        writeln!(buffer, "{}", &self.label).unwrap();
    }
}

// ANCHOR: main
fn main() {
    let mut window = Window::new("Rust GUI Demo 1.23");
    window.add_widget(Box::new(Label::new("This is a small text GUI demo.")));
    window.add_widget(Box::new(Button::new(
        "Click me!",
        Box::new(|| println!("You clicked the button!")),
    )));
    window.draw();
}
// ANCHOR_END: main

Pontos e PolĂ­gonos

(voltar ao exercĂ­cio)

// Copyright 2022 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

#[derive(Debug, Copy, Clone, PartialEq, Eq)]
// ANCHOR: Point
pub struct Point {
    // ANCHOR_END: Point
    x: i32,
    y: i32,
}

// ANCHOR: Point-impl
impl Point {
    // ANCHOR_END: Point-impl
    pub fn new(x: i32, y: i32) -> Point {
        Point { x, y }
    }

    pub fn magnitude(self) -> f64 {
        f64::from(self.x.pow(2) + self.y.pow(2)).sqrt()
    }

    pub fn dist(self, other: Point) -> f64 {
        (self - other).magnitude()
    }
}

impl std::ops::Add for Point {
    type Output = Self;

    fn add(self, other: Self) -> Self::Output {
        Self {
            x: self.x + other.x,
            y: self.y + other.y,
        }
    }
}

impl std::ops::Sub for Point {
    type Output = Self;

    fn sub(self, other: Self) -> Self::Output {
        Self {
            x: self.x - other.x,
            y: self.y - other.y,
        }
    }
}

// ANCHOR: Polygon
pub struct Polygon {
    // ANCHOR_END: Polygon
    points: Vec<Point>,
}

// ANCHOR: Polygon-impl
impl Polygon {
    // ANCHOR_END: Polygon-impl
    pub fn new() -> Polygon {
        Polygon { points: Vec::new() }
    }

    pub fn add_point(&mut self, point: Point) {
        self.points.push(point);
    }

    pub fn left_most_point(&self) -> Option<Point> {
        self.points.iter().min_by_key(|p| p.x).copied()
    }

    pub fn iter(&self) -> impl Iterator<Item = &Point> {
        self.points.iter()
    }

    pub fn length(&self) -> f64 {
        if self.points.is_empty() {
            return 0.0;
        }

        let mut result = 0.0;
        let mut last_point = self.points[0];
        for point in &self.points[1..] {
            result += last_point.dist(*point);
            last_point = *point;
        }
        result += last_point.dist(self.points[0]);
        result
        // Alternatively, Iterator::zip() lets us iterate over the points as pairs
        // but we need to pair each point with the next one, and the last point
        // with the first point. The zip() iterator is finished as soon as one of 
        // the source iterators is finished, a neat trick is to combine Iterator::cycle
        // with Iterator::skip to create the second iterator for the zip and using map 
        // and sum to calculate the total length.
    }
}

// ANCHOR: Circle
pub struct Circle {
    // ANCHOR_END: Circle
    center: Point,
    radius: i32,
}

// ANCHOR: Circle-impl
impl Circle {
    // ANCHOR_END: Circle-impl
    pub fn new(center: Point, radius: i32) -> Circle {
        Circle { center, radius }
    }

    pub fn circumference(&self) -> f64 {
        2.0 * std::f64::consts::PI * f64::from(self.radius)
    }

    pub fn dist(&self, other: &Self) -> f64 {
        self.center.dist(other.center)
    }
}

// ANCHOR: Shape
pub enum Shape {
    Polygon(Polygon),
    Circle(Circle),
}
// ANCHOR_END: Shape

impl From<Polygon> for Shape {
    fn from(poly: Polygon) -> Self {
        Shape::Polygon(poly)
    }
}

impl From<Circle> for Shape {
    fn from(circle: Circle) -> Self {
        Shape::Circle(circle)
    }
}

impl Shape {
    pub fn perimeter(&self) -> f64 {
        match self {
            Shape::Polygon(poly) => poly.length(),
            Shape::Circle(circle) => circle.circumference(),
        }
    }
}

// ANCHOR: unit-tests
#[cfg(test)]
mod tests {
    use super::*;

    fn round_two_digits(x: f64) -> f64 {
        (x * 100.0).round() / 100.0
    }

    #[test]
    fn test_point_magnitude() {
        let p1 = Point::new(12, 13);
        assert_eq!(round_two_digits(p1.magnitude()), 17.69);
    }

    #[test]
    fn test_point_dist() {
        let p1 = Point::new(10, 10);
        let p2 = Point::new(14, 13);
        assert_eq!(round_two_digits(p1.dist(p2)), 5.00);
    }

    #[test]
    fn test_point_add() {
        let p1 = Point::new(16, 16);
        let p2 = p1 + Point::new(-4, 3);
        assert_eq!(p2, Point::new(12, 19));
    }

    #[test]
    fn test_polygon_left_most_point() {
        let p1 = Point::new(12, 13);
        let p2 = Point::new(16, 16);

        let mut poly = Polygon::new();
        poly.add_point(p1);
        poly.add_point(p2);
        assert_eq!(poly.left_most_point(), Some(p1));
    }

    #[test]
    fn test_polygon_iter() {
        let p1 = Point::new(12, 13);
        let p2 = Point::new(16, 16);

        let mut poly = Polygon::new();
        poly.add_point(p1);
        poly.add_point(p2);

        let points = poly.iter().cloned().collect::<Vec<_>>();
        assert_eq!(points, vec![Point::new(12, 13), Point::new(16, 16)]);
    }

    #[test]
    fn test_shape_perimeters() {
        let mut poly = Polygon::new();
        poly.add_point(Point::new(12, 13));
        poly.add_point(Point::new(17, 11));
        poly.add_point(Point::new(16, 16));
        let shapes = vec![
            Shape::from(poly),
            Shape::from(Circle::new(Point::new(10, 20), 5)),
        ];
        let perimeters = shapes
            .iter()
            .map(Shape::perimeter)
            .map(round_two_digits)
            .collect::<Vec<_>>();
        assert_eq!(perimeters, vec![15.48, 31.42]);
    }
}
// ANCHOR_END: unit-tests

fn main() {}

Dia 3 ExercĂ­cios da Tarde

Wrapper FFI seguro

(voltar ao exercĂ­cio)

// Copyright 2022 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

// ANCHOR: ffi
mod ffi {
    use std::os::raw::{c_char, c_int};
    #[cfg(not(target_os = "macos"))]
    use std::os::raw::{c_long, c_ulong, c_ushort, c_uchar};

    // Tipo opaco. Veja https://doc.rust-lang.org/nomicon/ffi.html.
    #[repr(C)]
    pub struct DIR {
        _data: [u8; 0],
        _marker: core::marker::PhantomData<(*mut u8, core::marker::PhantomPinned)>,
    }

    // Layout de acordo com a pĂĄgina man do Linux para readdir(3), onde ino_t e
    // off_t são resolvidos de acordo com as definiçÔes em
    // /usr/include/x86_64-linux-gnu/{sys/types.h, bits/typesizes.h}.
    #[cfg(not(target_os = "macos"))]
    #[repr(C)]
    pub struct dirent {
        pub d_ino: c_ulong,
        pub d_off: c_long,
        pub d_reclen: c_ushort,
        pub d_type: c_uchar,
        pub d_name: [c_char; 256],
    }

    // Layout de acordo com a pĂĄgina man do macOS man page para dir(5).
    #[cfg(all(target_os = "macos"))]
    #[repr(C)]
    pub struct dirent {
        pub d_fileno: u64,
        pub d_seekoff: u64,
        pub d_reclen: u16,
        pub d_namlen: u16,
        pub d_type: u8,
        pub d_name: [c_char; 1024],
    }

    extern "C" {
        pub fn opendir(s: *const c_char) -> *mut DIR;

        #[cfg(not(all(target_os = "macos", target_arch = "x86_64")))]
        pub fn readdir(s: *mut DIR) -> *const dirent;

        // Veja https://github.com/rust-lang/libc/issues/414 e a seção sobre
        // _DARWIN_FEATURE_64_BIT_INODE na pĂĄgina man do macOS para stat(2).
        //
        // "Plataformas que existiram antes destas atualizaçÔes estarem disponíveis" refere-se
        // ao macOS (ao contrĂĄrio do iOS / wearOS / etc.) em Intel e PowerPC.
        #[cfg(all(target_os = "macos", target_arch = "x86_64"))]
        #[link_name = "readdir$INODE64"]
        pub fn readdir(s: *mut DIR) -> *const dirent;

        pub fn closedir(s: *mut DIR) -> c_int;
    }
}

use std::ffi::{CStr, CString, OsStr, OsString};
use std::os::unix::ffi::OsStrExt;

#[derive(Debug)]
struct DirectoryIterator {
    path: CString,
    dir: *mut ffi::DIR,
}
// ANCHOR_END: ffi

// ANCHOR: DirectoryIterator
impl DirectoryIterator {
    fn new(path: &str) -> Result<DirectoryIterator, String> {
        // Call opendir and return a Ok value if that worked,
        // otherwise return Err with a message.
        // ANCHOR_END: DirectoryIterator
        let path = CString::new(path).map_err(|err| format!("Invalid path: {err}"))?;
        // SAFETY: path.as_ptr() cannot be NULL.
        let dir = unsafe { ffi::opendir(path.as_ptr()) };
        if dir.is_null() {
            Err(format!("Could not open {:?}", path))
        } else {
            Ok(DirectoryIterator { path, dir })
        }
    }
}

// ANCHOR: Iterator
impl Iterator for DirectoryIterator {
    type Item = OsString;
    fn next(&mut self) -> Option<OsString> {
        // Keep calling readdir until we get a NULL pointer back.
        // ANCHOR_END: Iterator
        // SAFETY: self.dir is never NULL.
        let dirent = unsafe { ffi::readdir(self.dir) };
        if dirent.is_null() {
            // We have reached the end of the directory.
            return None;
        }
        // SAFETY: dirent is not NULL and dirent.d_name is NUL
        // terminated.
        let d_name = unsafe { CStr::from_ptr((*dirent).d_name.as_ptr()) };
        let os_str = OsStr::from_bytes(d_name.to_bytes());
        Some(os_str.to_owned())
    }
}

// ANCHOR: Drop
impl Drop for DirectoryIterator {
    fn drop(&mut self) {
        // Call closedir as needed.
        // ANCHOR_END: Drop
        if !self.dir.is_null() {
            // SAFETY: self.dir is not NULL.
            if unsafe { ffi::closedir(self.dir) } != 0 {
                panic!("Could not close {:?}", self.path);
            }
        }
    }
}

// ANCHOR: main
fn main() -> Result<(), String> {
    let iter = DirectoryIterator::new(".")?;
    println!("files: {:#?}", iter.collect::<Vec<_>>());
    Ok(())
}
// ANCHOR_END: main

#[cfg(test)]
mod tests {
    use super::*;
    use std::error::Error;

    #[test]
    fn test_nonexisting_directory() {
        let iter = DirectoryIterator::new("no-such-directory");
        assert!(iter.is_err());
    }

    #[test]
    fn test_empty_directory() -> Result<(), Box<dyn Error>> {
        let tmp = tempfile::TempDir::new()?;
        let iter = DirectoryIterator::new(
            tmp.path().to_str().ok_or("Non UTF-8 character in path")?,
        )?;
        let mut entries = iter.collect::<Vec<_>>();
        entries.sort();
        assert_eq!(entries, &[".", ".."]);
        Ok(())
    }

    #[test]
    fn test_nonempty_directory() -> Result<(), Box<dyn Error>> {
        let tmp = tempfile::TempDir::new()?;
        std::fs::write(tmp.path().join("foo.txt"), "The Foo Diaries\n")?;
        std::fs::write(tmp.path().join("bar.png"), "<PNG>\n")?;
        std::fs::write(tmp.path().join("crab.rs"), "//! Crab\n")?;
        let iter = DirectoryIterator::new(
            tmp.path().to_str().ok_or("Non UTF-8 character in path")?,
        )?;
        let mut entries = iter.collect::<Vec<_>>();
        entries.sort();
        assert_eq!(entries, &[".", "..", "bar.png", "crab.rs", "foo.txt"]);
        Ok(())
    }
}

Bare Metal Rust Morning Exercise

BĂșssola

(back to exercise)

// Copyright 2023 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

// ANCHOR: top
#![no_main]
#![no_std]

extern crate panic_halt as _;

use core::fmt::Write;
use cortex_m_rt::entry;
// ANCHOR_END: top
use core::cmp::{max, min};
use lsm303agr::{AccelOutputDataRate, Lsm303agr, MagOutputDataRate};
use microbit::display::blocking::Display;
use microbit::hal::prelude::*;
use microbit::hal::twim::Twim;
use microbit::hal::uarte::{Baudrate, Parity, Uarte};
use microbit::hal::Timer;
use microbit::pac::twim0::frequency::FREQUENCY_A;
use microbit::Board;

const COMPASS_SCALE: i32 = 30000;
const ACCELEROMETER_SCALE: i32 = 700;

// ANCHOR: main
#[entry]
fn main() -> ! {
    let board = Board::take().unwrap();

    // Configure serial port.
    let mut serial = Uarte::new(
        board.UARTE0,
        board.uart.into(),
        Parity::EXCLUDED,
        Baudrate::BAUD115200,
    );

    // Set up the I2C controller and Inertial Measurement Unit.
    // ANCHOR_END: main
    writeln!(serial, "Setting up IMU...").unwrap();
    let i2c = Twim::new(board.TWIM0, board.i2c_internal.into(), FREQUENCY_A::K100);
    let mut imu = Lsm303agr::new_with_i2c(i2c);
    imu.init().unwrap();
    imu.set_mag_odr(MagOutputDataRate::Hz50).unwrap();
    imu.set_accel_odr(AccelOutputDataRate::Hz50).unwrap();
    let mut imu = imu.into_mag_continuous().ok().unwrap();

    // Set up display and timer.
    let mut timer = Timer::new(board.TIMER0);
    let mut display = Display::new(board.display_pins);

    let mut mode = Mode::Compass;
    let mut button_pressed = false;

    // ANCHOR: loop
    writeln!(serial, "Ready.").unwrap();

    loop {
        // Read compass data and log it to the serial port.
        // ANCHOR_END: loop
        while !(imu.mag_status().unwrap().xyz_new_data
            && imu.accel_status().unwrap().xyz_new_data)
        {}
        let compass_reading = imu.mag_data().unwrap();
        let accelerometer_reading = imu.accel_data().unwrap();
        writeln!(
            serial,
            "{},{},{}\t{},{},{}",
            compass_reading.x,
            compass_reading.y,
            compass_reading.z,
            accelerometer_reading.x,
            accelerometer_reading.y,
            accelerometer_reading.z,
        )
        .unwrap();

        let mut image = [[0; 5]; 5];
        let (x, y) = match mode {
            Mode::Compass => (
                scale(-compass_reading.x, -COMPASS_SCALE, COMPASS_SCALE, 0, 4) as usize,
                scale(compass_reading.y, -COMPASS_SCALE, COMPASS_SCALE, 0, 4) as usize,
            ),
            Mode::Accelerometer => (
                scale(
                    accelerometer_reading.x,
                    -ACCELEROMETER_SCALE,
                    ACCELEROMETER_SCALE,
                    0,
                    4,
                ) as usize,
                scale(
                    -accelerometer_reading.y,
                    -ACCELEROMETER_SCALE,
                    ACCELEROMETER_SCALE,
                    0,
                    4,
                ) as usize,
            ),
        };
        image[y][x] = 255;
        display.show(&mut timer, image, 100);

        // If button A is pressed, switch to the next mode and briefly blink all LEDs on.
        if board.buttons.button_a.is_low().unwrap() {
            if !button_pressed {
                mode = mode.next();
                display.show(&mut timer, [[255; 5]; 5], 200);
            }
            button_pressed = true;
        } else {
            button_pressed = false;
        }
    }
}

#[derive(Copy, Clone, Debug, Eq, PartialEq)]
enum Mode {
    Compass,
    Accelerometer,
}

impl Mode {
    fn next(self) -> Self {
        match self {
            Self::Compass => Self::Accelerometer,
            Self::Accelerometer => Self::Compass,
        }
    }
}

fn scale(value: i32, min_in: i32, max_in: i32, min_out: i32, max_out: i32) -> i32 {
    let range_in = max_in - min_in;
    let range_out = max_out - min_out;
    cap(
        min_out + range_out * (value - min_in) / range_in,
        min_out,
        max_out,
    )
}

fn cap(value: i32, min_value: i32, max_value: i32) -> i32 {
    max(min_value, min(value, max_value))
}

Bare Metal Rust Tarde

RTC driver

(back to exercise)

main.rs:

// Copyright 2023 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

// ANCHOR: top
#![no_main]
#![no_std]

mod exceptions;
mod logger;
mod pl011;
// ANCHOR_END: top
mod pl031;

use crate::pl031::Rtc;
use arm_gic::gicv3::{IntId, Trigger};
use arm_gic::{irq_enable, wfi};
use chrono::{TimeZone, Utc};
use core::hint::spin_loop;
// ANCHOR: imports
use crate::pl011::Uart;
use arm_gic::gicv3::GicV3;
use core::panic::PanicInfo;
use log::{error, info, trace, LevelFilter};
use smccc::psci::system_off;
use smccc::Hvc;

/// Base addresses of the GICv3.
const GICD_BASE_ADDRESS: *mut u64 = 0x800_0000 as _;
const GICR_BASE_ADDRESS: *mut u64 = 0x80A_0000 as _;

/// Base address of the primary PL011 UART.
const PL011_BASE_ADDRESS: *mut u32 = 0x900_0000 as _;
// ANCHOR_END: imports

/// Base address of the PL031 RTC.
const PL031_BASE_ADDRESS: *mut u32 = 0x901_0000 as _;
/// The IRQ used by the PL031 RTC.
const PL031_IRQ: IntId = IntId::spi(2);

// ANCHOR: main
#[no_mangle]
extern "C" fn main(x0: u64, x1: u64, x2: u64, x3: u64) {
    // Safe because `PL011_BASE_ADDRESS` is the base address of a PL011 device,
    // and nothing else accesses that address range.
    let uart = unsafe { Uart::new(PL011_BASE_ADDRESS) };
    logger::init(uart, LevelFilter::Trace).unwrap();

    info!("main({:#x}, {:#x}, {:#x}, {:#x})", x0, x1, x2, x3);

    // Safe because `GICD_BASE_ADDRESS` and `GICR_BASE_ADDRESS` are the base
    // addresses of a GICv3 distributor and redistributor respectively, and
    // nothing else accesses those address ranges.
    let mut gic = unsafe { GicV3::new(GICD_BASE_ADDRESS, GICR_BASE_ADDRESS) };
    gic.setup();
    // ANCHOR_END: main

    // Safe because `PL031_BASE_ADDRESS` is the base address of a PL031 device,
    // and nothing else accesses that address range.
    let mut rtc = unsafe { Rtc::new(PL031_BASE_ADDRESS) };
    let timestamp = rtc.read();
    let time = Utc.timestamp_opt(timestamp.into(), 0).unwrap();
    info!("RTC: {time}");

    GicV3::set_priority_mask(0xff);
    gic.set_interrupt_priority(PL031_IRQ, 0x80);
    gic.set_trigger(PL031_IRQ, Trigger::Level);
    irq_enable();
    gic.enable_interrupt(PL031_IRQ, true);

    // Wait for 3 seconds, without interrupts.
    let target = timestamp + 3;
    rtc.set_match(target);
    info!(
        "Waiting for {}",
        Utc.timestamp_opt(target.into(), 0).unwrap()
    );
    trace!(
        "matched={}, interrupt_pending={}",
        rtc.matched(),
        rtc.interrupt_pending()
    );
    while !rtc.matched() {
        spin_loop();
    }
    trace!(
        "matched={}, interrupt_pending={}",
        rtc.matched(),
        rtc.interrupt_pending()
    );
    info!("Finished waiting");

    // Wait another 3 seconds for an interrupt.
    let target = timestamp + 6;
    info!(
        "Waiting for {}",
        Utc.timestamp_opt(target.into(), 0).unwrap()
    );
    rtc.set_match(target);
    rtc.clear_interrupt();
    rtc.enable_interrupt(true);
    trace!(
        "matched={}, interrupt_pending={}",
        rtc.matched(),
        rtc.interrupt_pending()
    );
    while !rtc.interrupt_pending() {
        wfi();
    }
    trace!(
        "matched={}, interrupt_pending={}",
        rtc.matched(),
        rtc.interrupt_pending()
    );
    info!("Finished waiting");

    // ANCHOR: main_end
    system_off::<Hvc>().unwrap();
}

#[panic_handler]
fn panic(info: &PanicInfo) -> ! {
    error!("{info}");
    system_off::<Hvc>().unwrap();
    loop {}
}
// ANCHOR_END: main_end

pl031.rs:

#![allow(unused)]
fn main() {
// Copyright 2023 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

use core::ptr::{addr_of, addr_of_mut};

#[repr(C, align(4))]
struct Registers {
    /// Data register
    dr: u32,
    /// Match register
    mr: u32,
    /// Load register
    lr: u32,
    /// Control register
    cr: u8,
    _reserved0: [u8; 3],
    /// Interrupt Mask Set or Clear register
    imsc: u8,
    _reserved1: [u8; 3],
    /// Raw Interrupt Status
    ris: u8,
    _reserved2: [u8; 3],
    /// Masked Interrupt Status
    mis: u8,
    _reserved3: [u8; 3],
    /// Interrupt Clear Register
    icr: u8,
    _reserved4: [u8; 3],
}

/// Driver for a PL031 real-time clock.
#[derive(Debug)]
pub struct Rtc {
    registers: *mut Registers,
}

impl Rtc {
    /// Constructs a new instance of the RTC driver for a PL031 device at the
    /// given base address.
    ///
    /// # Safety
    ///
    /// The given base address must point to the MMIO control registers of a
    /// PL031 device, which must be mapped into the address space of the process
    /// as device memory and not have any other aliases.
    pub unsafe fn new(base_address: *mut u32) -> Self {
        Self {
            registers: base_address as *mut Registers,
        }
    }

    /// Reads the current RTC value.
    pub fn read(&self) -> u32 {
        // Safe because we know that self.registers points to the control
        // registers of a PL031 device which is appropriately mapped.
        unsafe { addr_of!((*self.registers).dr).read_volatile() }
    }

    /// Writes a match value. When the RTC value matches this then an interrupt
    /// will be generated (if it is enabled).
    pub fn set_match(&mut self, value: u32) {
        // Safe because we know that self.registers points to the control
        // registers of a PL031 device which is appropriately mapped.
        unsafe { addr_of_mut!((*self.registers).mr).write_volatile(value) }
    }

    /// Returns whether the match register matches the RTC value, whether or not
    /// the interrupt is enabled.
    pub fn matched(&self) -> bool {
        // Safe because we know that self.registers points to the control
        // registers of a PL031 device which is appropriately mapped.
        let ris = unsafe { addr_of!((*self.registers).ris).read_volatile() };
        (ris & 0x01) != 0
    }

    /// Returns whether there is currently an interrupt pending.
    ///
    /// This should be true if and only if `matched` returns true and the
    /// interrupt is masked.
    pub fn interrupt_pending(&self) -> bool {
        // Safe because we know that self.registers points to the control
        // registers of a PL031 device which is appropriately mapped.
        let ris = unsafe { addr_of!((*self.registers).mis).read_volatile() };
        (ris & 0x01) != 0
    }

    /// Sets or clears the interrupt mask.
    ///
    /// When the mask is true the interrupt is enabled; when it is false the
    /// interrupt is disabled.
    pub fn enable_interrupt(&mut self, mask: bool) {
        let imsc = if mask { 0x01 } else { 0x00 };
        // Safe because we know that self.registers points to the control
        // registers of a PL031 device which is appropriately mapped.
        unsafe { addr_of_mut!((*self.registers).imsc).write_volatile(imsc) }
    }

    /// Clears a pending interrupt, if any.
    pub fn clear_interrupt(&mut self) {
        // Safe because we know that self.registers points to the control
        // registers of a PL031 device which is appropriately mapped.
        unsafe { addr_of_mut!((*self.registers).icr).write_volatile(0x01) }
    }
}

// Safe because it just contains a pointer to device memory, which can be
// accessed from any context.
unsafe impl Send for Rtc {}
}

Concurrency Morning Exercise

FilĂłsofos Jantando

(voltar ao exercĂ­cio)

// Copyright 2022 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

// ANCHOR: Philosopher
use std::sync::{mpsc, Arc, Mutex};
use std::thread;
use std::time::Duration;

struct Fork;

struct Philosopher {
    name: String,
    // ANCHOR_END: Philosopher
    left_fork: Arc<Mutex<Fork>>,
    right_fork: Arc<Mutex<Fork>>,
    thoughts: mpsc::SyncSender<String>,
}

// ANCHOR: Philosopher-think
impl Philosopher {
    fn think(&self) {
        self.thoughts
            .send(format!("Eureka! {} has a new idea!", &self.name))
            .unwrap();
    }
    // ANCHOR_END: Philosopher-think

    // ANCHOR: Philosopher-eat
    fn eat(&self) {
        // ANCHOR_END: Philosopher-eat
        println!("{} is trying to eat", &self.name);
        let left = self.left_fork.lock().unwrap();
        let right = self.right_fork.lock().unwrap();

        // ANCHOR: Philosopher-eat-end
        println!("{} is eating...", &self.name);
        thread::sleep(Duration::from_millis(10));
    }
}

static PHILOSOPHERS: &[&str] =
    &["Socrates", "Plato", "Aristotle", "Thales", "Pythagoras"];

fn main() {
    // ANCHOR_END: Philosopher-eat-end
    let (tx, rx) = mpsc::sync_channel(10);

    let forks = (0..PHILOSOPHERS.len())
        .map(|_| Arc::new(Mutex::new(Fork)))
        .collect::<Vec<_>>();

    for i in 0..forks.len() {
        let tx = tx.clone();
        let mut left_fork = Arc::clone(&forks[i]);
        let mut right_fork = Arc::clone(&forks[(i + 1) % forks.len()]);

        // To avoid a deadlock, we have to break the symmetry
        // somewhere. This will swap the forks without deinitializing
        // either of them.
        if i == forks.len() - 1 {
            std::mem::swap(&mut left_fork, &mut right_fork);
        }

        let philosopher = Philosopher {
            name: PHILOSOPHERS[i].to_string(),
            thoughts: tx,
            left_fork,
            right_fork,
        };

        thread::spawn(move || {
            for _ in 0..100 {
                philosopher.eat();
                philosopher.think();
            }
        });
    }

    drop(tx);
    for thought in rx {
        println!("{thought}");
    }
}

(back to exercise)

// Copyright 2022 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

use std::{sync::Arc, sync::Mutex, sync::mpsc, thread};

// ANCHOR: setup
use reqwest::{blocking::Client, Url};
use scraper::{Html, Selector};
use thiserror::Error;

#[derive(Error, Debug)]
enum Error {
    #[error("request error: {0}")]
    ReqwestError(#[from] reqwest::Error),
    #[error("bad http response: {0}")]
    BadResponse(String),
}
// ANCHOR_END: setup

// ANCHOR: visit_page
#[derive(Debug)]
struct CrawlCommand {
    url: Url,
    extract_links: bool,
}

fn visit_page(client: &Client, command: &CrawlCommand) -> Result<Vec<Url>, Error> {
    println!("Checking {:#}", command.url);
    let response = client.get(command.url.clone()).send()?;
    if !response.status().is_success() {
        return Err(Error::BadResponse(response.status().to_string()));
    }

    let mut link_urls = Vec::new();
    if !command.extract_links {
        return Ok(link_urls);
    }

    let base_url = response.url().to_owned();
    let body_text = response.text()?;
    let document = Html::parse_document(&body_text);

    let selector = Selector::parse("a").unwrap();
    let href_values = document
        .select(&selector)
        .filter_map(|element| element.value().attr("href"));
    for href in href_values {
        match base_url.join(href) {
            Ok(link_url) => {
                link_urls.push(link_url);
            }
            Err(err) => {
                println!("On {base_url:#}: ignored unparsable {href:?}: {err}");
            }
        }
    }
    Ok(link_urls)
}
// ANCHOR_END: visit_page

struct CrawlState {
    domain: String,
    visited_pages: std::collections::HashSet<String>,
}

impl CrawlState {
    fn new(start_url: &Url) -> CrawlState {
        let mut visited_pages = std::collections::HashSet::new();
        visited_pages.insert(start_url.as_str().to_string());
        CrawlState {
            domain: start_url.domain().unwrap().to_string(),
            visited_pages,
        }
    }

    /// Determine whether links within the given page should be extracted.
    fn should_extract_links(&self, url: &Url) -> bool {
        let Some(url_domain) = url.domain() else {
            return false;
        };
        url_domain == self.domain
    }

    /// Mark the given page as visited, returning true if it had already
    /// been visited.
    fn mark_visited(&mut self, url: &Url) -> bool {
        self.visited_pages.insert(url.as_str().to_string())
    }
}

type CrawlResult = Result<Vec<Url>, (Url, Error)>;
fn spawn_crawler_threads(
    command_receiver: mpsc::Receiver<CrawlCommand>,
    result_sender: mpsc::Sender<CrawlResult>,
    thread_count: u32,
) {
    let command_receiver = Arc::new(Mutex::new(command_receiver));

    for _ in 0..thread_count {
        let result_sender = result_sender.clone();
        let command_receiver = command_receiver.clone();
        thread::spawn(move || {
            let client = Client::new();
            loop {
                let command_result = {
                    let receiver_guard = command_receiver.lock().unwrap();
                    receiver_guard.recv()
                };
                let Ok(crawl_command) = command_result else {
                    // The sender got dropped. No more commands coming in.
                    break;
                };
                let crawl_result = match visit_page(&client, &crawl_command) {
                    Ok(link_urls) => Ok(link_urls),
                    Err(error) => Err((crawl_command.url, error)),
                };
                result_sender.send(crawl_result).unwrap();
            }
        });
    }
}

fn control_crawl(
    start_url: Url,
    command_sender: mpsc::Sender<CrawlCommand>,
    result_receiver: mpsc::Receiver<CrawlResult>,
) -> Vec<Url> {
    let mut crawl_state = CrawlState::new(&start_url);
    let start_command = CrawlCommand { url: start_url, extract_links: true };
    command_sender.send(start_command).unwrap();
    let mut pending_urls = 1;

    let mut bad_urls = Vec::new();
    while pending_urls > 0 {
        let crawl_result = result_receiver.recv().unwrap();
        pending_urls -= 1;

        match crawl_result {
            Ok(link_urls) => {
                for url in link_urls {
                    if crawl_state.mark_visited(&url) {
                        let extract_links = crawl_state.should_extract_links(&url);
                        let crawl_command = CrawlCommand { url, extract_links };
                        command_sender.send(crawl_command).unwrap();
                        pending_urls += 1;
                    }
                }
            }
            Err((url, error)) => {
                bad_urls.push(url);
                println!("Got crawling error: {:#}", error);
                continue;
            }
        }
    }
    bad_urls
}

fn check_links(start_url: Url) -> Vec<Url> {
    let (result_sender, result_receiver) = mpsc::channel::<CrawlResult>();
    let (command_sender, command_receiver) = mpsc::channel::<CrawlCommand>();
    spawn_crawler_threads(command_receiver, result_sender, 16);
    control_crawl(start_url, command_sender, result_receiver)
}

fn main() {
    let start_url = reqwest::Url::parse("https://www.google.org").unwrap();
    let bad_urls = check_links(start_url);
    println!("Bad URLs: {:#?}", bad_urls);
}

Concurrency Afternoon Exercise

Dining Philosophers - Async

(back to exercise)

// Copyright 2023 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

// ANCHOR: Philosopher
use std::sync::Arc;
use tokio::time;
use tokio::sync::mpsc::{self, Sender};
use tokio::sync::Mutex;

struct Fork;

struct Philosopher {
    name: String,
    // ANCHOR_END: Philosopher
    left_fork: Arc<Mutex<Fork>>,
    right_fork: Arc<Mutex<Fork>>,
    thoughts: Sender<String>,
}

// ANCHOR: Philosopher-think
impl Philosopher {
    async fn think(&self) {
        self.thoughts
            .send(format!("Eureka! {} has a new idea!", &self.name)).await
            .unwrap();
    }
    // ANCHOR_END: Philosopher-think

    // ANCHOR: Philosopher-eat
    async fn eat(&self) {
        // Pick up forks...
        // ANCHOR_END: Philosopher-eat
        let _first_lock = self.left_fork.lock().await;
        // Add a delay before picking the second fork to allow the execution
        // to transfer to another task
        time::sleep(time::Duration::from_millis(1)).await;
        let _second_lock = self.right_fork.lock().await;

        // ANCHOR: Philosopher-eat-body
        println!("{} is eating...", &self.name);
        time::sleep(time::Duration::from_millis(5)).await;
        // ANCHOR_END: Philosopher-eat-body

        // The locks are dropped here
        // ANCHOR: Philosopher-eat-end
    }
}

static PHILOSOPHERS: &[&str] =
    &["Socrates", "Plato", "Aristotle", "Thales", "Pythagoras"];

#[tokio::main]
async fn main() {
    // ANCHOR_END: Philosopher-eat-end
    // Create forks
    let mut forks = vec![];
    (0..PHILOSOPHERS.len()).for_each(|_| forks.push(Arc::new(Mutex::new(Fork))));

    // Create philosophers
    let (philosophers, mut rx) = {
        let mut philosophers = vec![];
        let (tx, rx) = mpsc::channel(10);
        for (i, name) in PHILOSOPHERS.iter().enumerate() {
            let left_fork = Arc::clone(&forks[i]);
            let right_fork = Arc::clone(&forks[(i + 1) % PHILOSOPHERS.len()]);
            // To avoid a deadlock, we have to break the symmetry
            // somewhere. This will swap the forks without deinitializing
            // either of them.
            if i  == 0 {
                std::mem::swap(&mut left_fork, &mut right_fork);
            }
            philosophers.push(Philosopher {
                name: name.to_string(),
                left_fork,
                right_fork,
                thoughts: tx.clone(),
            });
        }
        (philosophers, rx)
        // tx is dropped here, so we don't need to explicitly drop it later
    };

    // Make them think and eat
    for phil in philosophers {
        tokio::spawn(async move {
            for _ in 0..100 {
                phil.think().await;
                phil.eat().await;
            }
        });

    }

    // Output their thoughts
    while let Some(thought) = rx.recv().await {
        println!("Here is a thought: {thought}");
    }
}

Broadcast Chat Application

(back to exercise)

src/bin/server.rs:

// Copyright 2023 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

// ANCHOR: setup
use futures_util::sink::SinkExt;
use std::error::Error;
use std::net::SocketAddr;
use tokio::net::{TcpListener, TcpStream};
use tokio::sync::broadcast::{channel, Sender};
use tokio_websockets::{Message, ServerBuilder, WebsocketStream};
// ANCHOR_END: setup

// ANCHOR: handle_connection
async fn handle_connection(
    addr: SocketAddr,
    mut ws_stream: WebsocketStream<TcpStream>,
    bcast_tx: Sender<String>,
) -> Result<(), Box<dyn Error + Send + Sync>> {
    // ANCHOR_END: handle_connection

    ws_stream
        .send(Message::text("Welcome to chat! Type a message".into()))
        .await?;
    let mut bcast_rx = bcast_tx.subscribe();

    // A continuous loop for concurrently performing two tasks: (1) receiving
    // messages from `ws_stream` and broadcasting them, and (2) receiving
    // messages on `bcast_rx` and sending them to the client.
    loop {
        tokio::select! {
            incoming = ws_stream.next() => {
                match incoming {
                    Some(Ok(msg)) => {
                        let msg = msg.as_text()?;
                        println!("From client {addr:?} {msg:?}");
                        bcast_tx.send(msg.into())?;
                    }
                    Some(Err(err)) => return Err(err.into()),
                    None => return Ok(()),
                }
            }
            msg = bcast_rx.recv() => {
                ws_stream.send(Message::text(msg?)).await?;
            }
        }
    }
    // ANCHOR: main
}

#[tokio::main]
async fn main() -> Result<(), Box<dyn Error + Send + Sync>> {
    let (bcast_tx, _) = channel(16);

    let listener = TcpListener::bind("127.0.0.1:2000").await?;
    println!("listening on port 2000");

    loop {
        let (socket, addr) = listener.accept().await?;
        println!("New connection from {addr:?}");
        let bcast_tx = bcast_tx.clone();
        tokio::spawn(async move {
            // Wrap the raw TCP stream into a websocket.
            let ws_stream = ServerBuilder::new().accept(socket).await?;

            handle_connection(addr, ws_stream, bcast_tx).await
        });
    }
}
// ANCHOR_END: main

src/bin/client.rs:

// Copyright 2023 Google LLC
//
// Licensed under the Apache License, Version 2.0 (the "License");
// you may not use this file except in compliance with the License.
// You may obtain a copy of the License at
//
//      http://www.apache.org/licenses/LICENSE-2.0
//
// Unless required by applicable law or agreed to in writing, software
// distributed under the License is distributed on an "AS IS" BASIS,
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
// See the License for the specific language governing permissions and
// limitations under the License.

// ANCHOR: setup
use futures_util::SinkExt;
use http::Uri;
use tokio::io::{AsyncBufReadExt, BufReader};
use tokio_websockets::{ClientBuilder, Message};

#[tokio::main]
async fn main() -> Result<(), tokio_websockets::Error> {
    let mut ws_stream = ClientBuilder::from_uri(Uri::from_static("ws://127.0.0.1:2000"))
        .connect()
        .await?;

    let stdin = tokio::io::stdin();
    let mut stdin = BufReader::new(stdin).lines();

    // ANCHOR_END: setup
    // Continuous loop for concurrently sending and receiving messages.
    loop {
        tokio::select! {
            incoming = ws_stream.next() => {
                match incoming {
                    Some(Ok(msg)) => println!("From server: {}", msg.as_text()?),
                    Some(Err(err)) => return Err(err.into()),
                    None => return Ok(()),
                }
            }
            res = stdin.next_line() => {
                match res {
                    Ok(None) => return Ok(()),
                    Ok(Some(line)) => ws_stream.send(Message::text(line.to_string())).await?,
                    Err(err) => return Err(err.into()),
                }
            }

        }
    }
}