Bem-vindo ao Comprehensive Rust đŠ
Este Ă© um curso gratuito de Rust desenvolvido pela equipe do Android no Google. O curso abrange o espectro completo da linguagem, desde sintaxe bĂĄsica atĂ© tĂłpicos avançados como âgenericsâ e tratamento de erros.
O objetivo do curso Ă© ensinar Rust a vocĂȘ. NĂłs assumimos que vocĂȘ nĂŁo saiba nada sobre Rust e esperamos:
- Dar a vocĂȘ uma compreensĂŁo abrangente da linguagem e da sintaxe de Rust.
- Permitir que vocĂȘ modifique programas existentes e escreva novos programas em Rust.
- Demonstrar expressÔes idiomåticas comuns de Rust.
NĂłs chamamos os trĂȘs primeiros dias do curso de Fundamentos do Rust.
Em seguida, vocĂȘ estĂĄ convidado(a) a mergulhar a fundo em um ou mais tĂłpicos especializados:
- Android: um curso de meio dia sobre a utilização de Rust no desenvolvimento para a plataforma Android (AOSP). Isto inclui interoperabilidade com C, C++ e Java.
- Bare-metal: uma aula de um dia sobre a utilização de Rust para o desenvolvimento âbare metalâ (sistema embarcado). Tanto micro-controladores quanto processadores de aplicação sĂŁo cobertos.
- ConcorrĂȘncia: uma aula de um dia inteiro sobre concorrĂȘncia em Rust. NĂłs cobrimos tanto concorrĂȘncia clĂĄssica (escalonamento preemptivo utilizando threads e mutexes) quanto concorrĂȘncia async/await (multitarefa cooperativa utilizando futures).
Fora do escopo
Rust Ă© uma linguagem extensa e nĂŁo conseguiremos cobrir tudo em poucos dias. Alguns assuntos que nĂŁo sĂŁo objetivos deste curso sĂŁo:
- Aprender a criar macros: por favor confira CapĂtulo 19.5 em Rust Book e Rust by Example para esse fim.
Premissas
O curso pressupĂ”e que vocĂȘ jĂĄ saiba programar. Rust Ă© uma linguagem de tipagem estĂĄtica e ocasionalmente faremos comparaçÔes com C e C++ para melhor explicar ou contrastar a abordagem do Rust.
Se vocĂȘ sabe programar em uma linguagem de tipagem dinĂąmica, como Python ou JavaScript, entĂŁo vocĂȘ tambĂ©m serĂĄ capaz de acompanhar.
Este Ă© um exemplo de uma nota do instrutor. NĂłs as usaremos para adicionar informaçÔes complementares aos slides. Elas podem ser tanto pontos-chave que o instrutor deve cobrir quanto respostas a perguntas tĂpicas que surgem em sala de aula.
Conduzindo o Curso
Esta pĂĄgina Ă© para o instrutor do curso.
Aqui estão algumas informaçÔes båsicas sobre como estamos conduzindo o curso internamente no Google.
Antes de oferecer o curso, vocĂȘ precisa:
-
Familiarize-se com o material do curso. IncluĂmos notas do instrutor para ajudar a destacar os pontos principais (ajude-nos contribuindo com mais notas!). Ao apresentar, certifique-se de abrir as notas do instrutor em um pop-up (clique no link com uma pequena seta ao lado de âSpeaker Notesâ ou âNotas do Instrutorâ). Desta forma vocĂȘ tem uma tela limpa para apresentar Ă turma.
-
Decida as datas. Como o curso leva pelo menos trĂȘs dias completos, recomendamos que vocĂȘ agende os dias ao longo de duas semanas. Os participantes do curso disseram que eles acham Ăștil ter uma lacuna no curso, pois os ajuda a processar todas as informaçÔes que lhes damos.
-
Encontre uma sala grande o suficiente para seus participantes presenciais. Recomendamos turmas de 15 a 25 pessoas. Isso Ă© pequeno o suficiente para que as pessoas se sintam confortĂĄveis fazendo perguntas â tambĂ©m Ă© pequeno o suficiente para que um instrutor tenha tempo para responder Ă s perguntas. Certifique-se de que a sala tenha mesas para vocĂȘ e para os alunos: todos vocĂȘs precisam ser capazes de sentar e trabalhar com seus laptops. Em particular, vocĂȘ farĂĄ muita codificação ao vivo como instrutor, portanto, um pĂłdio nĂŁo serĂĄ muito Ăștil para vocĂȘ.
-
No dia do seu curso, chegue um pouco mais cedo na sala para acertar as coisas. Recomendamos apresentar diretamente usando
mdbook serve
rodando em seu laptop (consulte as instruçÔes de instalação). Isso garante um desempenho ideal sem atrasos conforme vocĂȘ muda de pĂĄgina. Usar seu laptop tambĂ©m permitirĂĄ que vocĂȘ corrija erros de digitação enquanto vocĂȘ ou os participantes do curso os identificam. -
Deixe as pessoas resolverem os exercĂcios sozinhas ou em pequenos grupos. Normalmente gastamos de 30 a 45 minutos em exercĂcios pela manhĂŁ e Ă tarde (incluindo o tempo para revisar as soluçÔes). Tenha certeza de perguntar Ă s pessoas se elas estĂŁo em dificuldades ou se hĂĄ algo em que vocĂȘ possa ajudar. Quando vocĂȘ vir que vĂĄrias pessoas tĂȘm o mesmo problema, chame a turma e ofereça uma solução, por exemplo, mostrando Ă s pessoas onde encontrar as informaçÔes relevantes na biblioteca padrĂŁo (âstandard libraryâ).
Isso Ă© tudo, boa sorte no curso! Esperamos que seja tĂŁo divertido para vocĂȘ como tem sido para nĂłs!
Por favor, dĂȘ seu feedback depois para que possamos continuar melhorando o curso. AdorarĂamos saber o que funcionou bem para vocĂȘ e o que pode ser melhorado. Seus alunos tambĂ©m sĂŁo muito bem-vindos para nos enviar feedback!
Estrutura do Curso
Esta pĂĄgina Ă© para o instrutor do curso.
O curso Ă© rĂĄpido e muito abrangente:
- Day 1: Basic Rust, syntax, control flow, creating and consuming values.
- Day 2: Memory management, ownership, compound data types, and the standard library.
- Day 3: Generics, traits, error handling, testing, and unsafe Rust.
AnĂĄlises Detalhadas
Além do curso de 3 dias sobre fundamentos de Rust, nós abordamos alguns tópicos mais especializados:
Rust in Android
The Rust in Android deep dive is a half-day course on using Rust for Android platform development. This includes interoperability with C, C++, and Java.
VocĂȘ precisarĂĄ de um checkout do AOSP. Faça um checkout do repositĂłrio do curso no mesmo computador e mova o diretĂłrio src/android/
para a raiz do seu checkout do AOSP. Isso garantirå que o sistema de compilação do Android veja os arquivos Android.bp
em src/android/
.
Certifique-se de que adb sync
funcione com seu emulador ou dispositivo fĂsico e prĂ©-compile todos os exemplos do Android usando src/android/build_all.sh
. Leia o roteiro para ver os comandos executados e verifique se eles funcionam quando vocĂȘ os executa manualmente.
Bare-Metal Rust
The Bare-Metal Rust deep dive is a full day class on using Rust for bare-metal (embedded) development. Both microcontrollers and application processors are covered.
Para a parte do micro-controlador, vocĂȘ precisarĂĄ comprar a placa de desenvolvimento BBC micro:bit v2 com antecedĂȘncia. Todos precisarĂŁo instalar vĂĄrios pacotes, conforme descrito na pĂĄgina inicial.
Concurrency in Rust
The Concurrency in Rust deep dive is a full day class on classical as well as async
/await
concurrency.
VocĂȘ precisarĂĄ de um novo crate configurado e as dependĂȘncias baixadas e prontas para uso. VocĂȘ pode entĂŁo copiar/colar os exemplos para src/main.rs
para experimentĂĄ-los:
cargo init concurrency
cd concurrency
cargo add tokio --features full
cargo run
Formato
O curso foi projetado para ser bastante interativo e recomendamos deixar as perguntas conduzirem a exploração de Rust!
Atalhos de Teclado
Existem vĂĄrios atalhos de teclado Ășteis no mdBook:
- Seta para a esquerda: Vai para a pĂĄgina anterior.
- Seta para a direita: Vai para a prĂłxima pĂĄgina.
- Ctrl + Enter: Executa o exemplo de cĂłdigo que tem o foco.
- S: Ativa a barra de pesquisa.
TraduçÔes
O curso foi traduzido para outros idiomas por um grupo de voluntĂĄrios maravilhosos:
- PortuguĂȘs do Brasil por @rastringer, @hugojacob, @joaovicmendes e @henrif75.
- Coreano por @keispace, @jiyongp e @jooyunghan.
Use o seletor de idioma no canto superior direito para alternar entre os idiomas.
TraduçÔes Incompletas
HĂĄ um grande nĂșmero de traduçÔes em andamento. NĂłs referenciamos as traduçÔes mais recentemente atualizadas:
- Bengali por @raselmandol.
- FrancĂȘs por @KookaS e @vcaen.
- AlemĂŁo por @Throvn e @ronaldfw.
- JaponĂȘs por @CoinEZ-JPN e @momotaro1105.
Se vocĂȘ quiser ajudar com esse esforço, consulte nossas instruçÔes sobre como proceder. As traduçÔes sĂŁo coordenadas no issue tracker.
Usando o Cargo
Quando vocĂȘ começar a ler sobre Rust, logo conhecerĂĄ o Cargo, a ferramenta padrĂŁo usada no ecossistema Rust para criar e executar aplicativos Rust. Aqui nĂłs queremos dar uma breve visĂŁo geral do que Ă© o Cargo e como ele se encaixa no ecossistema mais amplo e como ele se encaixa neste treinamento.
Instalação
Por favor, siga as instruçÔes em https://rustup.rs/.
Isso fornecerå a ferramenta de compilação Cargo (cargo
) e o compilador Rust (rustc
). VocĂȘ tambĂ©m obterĂĄ o rustup
, um utilitĂĄrio de linha de comando que vocĂȘ pode usar para instalar/alternar ferramentas, configurar compilação cruzada, etc.
- No Debian/Ubuntu, vocĂȘ tambĂ©m pode instalar o Cargo, o cĂłdigo-fonte do Rust e o formatador Rust com
apt
. Entretanto, isto lhe fornece uma versĂŁo desatualizada do Rust e pode levar a comportamentos inesperados. O comando seria:
sudo apt install cargo rust-src rustfmt
-
Nós sugerimos a utilização do VS Code para editar o código (mas qualquer editor LSP - Language Server Protocol - funciona com o rust-analyzer3).
-
Algumas pessoas tambĂ©m gostam de usar a famĂlia de IDEs JetBrains, que fazem suas prĂłprias anĂĄlises, mas tĂȘm suas prĂłprias vantagens e desvantagens. Se vocĂȘ preferi-las, pode instalar o Plugin Rust. Observe que, a partir de Janeiro de 2023, a depuração funciona apenas na versĂŁo CLion do pacote JetBrains IDEA.
O ecossistema do Rust
O ecossistema Rust consiste em vĂĄrias ferramentas, das quais as principais sĂŁo:
-
rustc
: o compilador Rust que converte arquivos.rs
em binĂĄrios e outros formatos intermediĂĄrios. -
cargo
: o gerenciador de dependĂȘncias e ferramenta de compilação do Rust. O Cargo sabe como baixar dependĂȘncias, normalmente hospedadas em https://crates.io, e as passarĂĄ para orustc
quando compilar o seu projeto. O Cargo também vem com um gerenciador de testes embutido que é utilizado para a execução de testes unitårios. -
rustup
: o instalador e atualizador do conjunto de ferramentas do Rust. Esta ferramenta Ă© utilizada para instalar e atualizar orustc
e ocargo
quando novas versÔes do Rust forem lançadas. Além disso,rustup
tambĂ©m pode baixar a documentação da biblioteca padrĂŁo. VocĂȘ pode ter mĂșltiplas versĂ”es do Rust instaladas ao mesmo tempo erustup
permitirĂĄ que vocĂȘ alterne entre elas conforme necessĂĄrio.
Pontos chave:
-
O Rust tem um cronograma de lançamento rĂĄpido com um novo lançamento saindo a cada seis semanas. Novos lançamentos mantĂȘm compatibilidade com versĂ”es anteriores â alĂ©m disso, eles habilitam novas funcionalidades.
-
Existem trĂȘs canais de lançamento: âstableâ, âbetaâ e ânightlyâ.
-
Novos recursos estĂŁo sendo testados em ânightlyâ, âbetaâ Ă© o que se torna âstableâ a cada seis semanas.
-
DependĂȘncias tambĂ©m podem ser resolvidas a partir de registros alternativos, git, pastas, e outros mais.
-
O Rust também tem ediçÔes: a edição atual é o Rust 2021. As ediçÔes anteriores foram o Rust 2015 e o Rust 2018.
-
As ediçÔes podem fazer alteraçÔes incompatĂveis com versĂ”es anteriores da linguagem.
-
Para evitar quebra de cĂłdigo, as ediçÔes sĂŁo opcionais: vocĂȘ seleciona a edição para o seu crate atravĂ©s do arquivo
Cargo.toml
. -
Para evitar a divisão do ecossistema, os compiladores Rust podem misturar código escrito para diferentes ediçÔes.
-
Mencione que é muito raro usar o compilador diretamente, não através do
cargo
(a maioria dos usuĂĄrios nunca o faz). -
Pode valer a pena mencionar que o próprio Cargo é uma ferramenta extremamente poderosa e abrangente. Ele é capaz de muitos recursos avançados, incluindo, entre outros:
- Estrutura do projeto/pacote
- Espaços de trabalho
- DependĂȘncias de desenvolvimento e gerenciamento/cache de dependĂȘncia de tempo de execução
- Criar scripts
- Instalação global
- TambĂ©m Ă© extensĂvel com plugins de sub-comando (tais como cargo clippy).
-
Leia mais no livro oficial do Cargo
-
Exemplos de CĂłdigo neste Treinamento
Para este treinamento, exploraremos principalmente a linguagem Rust por meio de exemplos que podem ser executados atravĂ©s do seu navegador. Isso torna a instalação muito mais fĂĄcil e garante uma experiĂȘncia consistente para todos.
A instalação do Cargo ainda assim Ă© incentivada: serĂĄ mais fĂĄcil para vocĂȘ fazer os exercĂcios. No Ășltimo dia, faremos um exercĂcio maior que mostra como trabalhar com dependĂȘncias e para isso vocĂȘ precisarĂĄ do Cargo.
Os blocos de cĂłdigo neste curso sĂŁo totalmente interativos:
fn main() { println!("Edite-me!"); }
VocĂȘ pode usar Ctrl + Enter to execute the code when focus is in the text box.
A maioria dos exemplos de cĂłdigo sĂŁo editĂĄveis, como mostrado acima. Alguns exemplos de cĂłdigo nĂŁo sĂŁo editĂĄveis por vĂĄrios motivos:
-
Os playgrounds embutidos nĂŁo conseguem executar testes unitĂĄrios. Copie o cĂłdigo e cole no Playground real para demonstrar os testes unitĂĄrios.
-
Os playgrounds embutidos perdem seu estado no momento em que vocĂȘ navega para outra pĂĄgina! Esta Ă© a razĂŁo pela qual os alunos devem resolver os exercĂcios usando uma instalação do Rust local ou via Playground real.
Executando CĂłdigo Localmente com o Cargo
Se vocĂȘ quiser experimentar o cĂłdigo em seu prĂłprio sistema, precisarĂĄ primeiro instalar o Rust. Faça isso seguindo as instruçÔes no Livro do Rust. Isso deve fornecer o rustc
e o cargo
funcionando. Quando este curso foi escrito, as Ășltimas versĂ”es estĂĄveis do Rust sĂŁo:
% rustc --version
rustc 1.69.0 (84c898d65 2023-04-16)
% cargo --version
cargo 1.69.0 (6e9a83356 2023-04-12)
VocĂȘ tambĂ©m pode usar qualquer versĂŁo posterior, pois o Rust mantĂ©m compatibilidade com versĂ”es anteriores.
Com isso finalizado, siga estas etapas para criar um binĂĄrio Rust a partir de um dos exemplos deste treinamento:
-
Clique no botĂŁo âCopy to clipboardâ (âCopiar para a ĂĄrea de transferĂȘnciaâ) no exemplo que deseja copiar.
-
Use
cargo new exercise
para criar um novo diretĂłrioexercise/
para o seu cĂłdigo:$ cargo new exercise Created binary (application) `exercise` package
-
Navegue até
exercise/
e usecargo run
para compilar e executar seu binĂĄrio:$ cd exercise $ cargo run Compiling exercise v0.1.0 (/home/mgeisler/tmp/exercise) Finished dev [unoptimized + debuginfo] target(s) in 0.75s Running `target/debug/exercise` Hello, world!
-
Substitua o cĂłdigo gerado em
src/main.rs
pelo seu próprio código. Por exemplo, usando o exemplo da pågina anterior, façasrc/main.rs
parecer comofn main() { println!("Edite-me!"); }
-
Use
cargo run
para compilar e executar seu binĂĄrio atualizado:$ cargo run Compiling exercise v0.1.0 (/home/mgeisler/tmp/exercise) Finished dev [unoptimized + debuginfo] target(s) in 0.24s Running `target/debug/exercise` Edit me!
-
Use
cargo check
para verificar rapidamente se hĂĄ erros em seu projeto, usecargo build
para compilĂĄ-lo sem executĂĄ-lo. VocĂȘ encontrarĂĄ a saĂda emtarget/debug/
para uma compilação de depuração normal. Usecargo build --release
para produzir um binĂĄrio otimizado emtarget/release/
. -
VocĂȘ pode adicionar dependĂȘncias para seu projeto editando
Cargo.toml
. Quando vocĂȘ execute os comandoscargo
, ele irĂĄ baixar e compilar automaticamente dependĂȘncias para vocĂȘ.
Tente encorajar os participantes do curso a instalar o Cargo e usar um editor local. Isso facilitarĂĄ a vida deles, pois eles terĂŁo um ambiente normal de desenvolvimento.
Bem-vindo ao Dia 1
Este Ă© o primeiro dia de Fundamentos do Rust. NĂłs iremos cobrir muitos pontos hoje:
-
Sintaxe Rust bĂĄsica: variĂĄveis, tipos escalares e compostos, enums, structs, referĂȘncias, funçÔes e mĂ©todos.
-
Construtos de fluxo de controle:
if
,if let
,while
,while let
,break
, econtinue
. -
CorrespondĂȘncia de padrĂ”es: desestruturando enums, structs, e arrays.
Lembre aos alunos que:
- Eles devem fazer perguntas na hora, nĂŁo as guarde para o fim.
- A aula é para ser interativa e as discussÔes são muito encorajadas!
- Como instrutor, vocĂȘ deve tentar manter as discussĂ”es relevantes, ou seja, mantenha as discussĂ”es relacionadas a como o Rust faz as coisas versus alguma outra linguagem. Pode ser difĂcil encontrar o equilĂbrio certo, mas procure permitir mais discussĂ”es, uma vez que elas engajam as pessoas muito mais do que uma comunicação unidirecional.
- As perguntas provavelmente farĂŁo com que falemos sobre coisas antes dos slides.
- Isso estĂĄ perfeitamente OK! A repetição Ă© uma parte importante do aprendizado. Lembre-se que os slides sĂŁo apenas um suporte e vocĂȘ estĂĄ livre para ignorĂĄ-los quando quiser.
A ideia para o primeiro dia Ă© mostrar apenas o suficiente de Rust para poder falar sobre o famoso borrow checker (verificador de emprĂ©stimos). A maneira como o Rust lida com a memĂłria Ă© uma caracterĂstica importante e devemos mostrar isso aos alunos imediatamente.
Se vocĂȘ estiver ensinando isso em uma sala de aula, este Ă© um bom lugar para repassar o cronograma. Sugerimos dividir o dia em duas partes (seguindo os slides):
- ManhĂŁ: 9h Ă s 12h,
- Tarde: 13h Ă s 16h.
Ă claro que vocĂȘ pode ajustar isso conforme necessĂĄrio. Certifique-se de incluir pausas, recomendamos uma a cada hora!
O que Ă© Rust?
Rust é uma nova linguagem de programação que teve sua versão 1.0 lançada em 2015:
- Rust Ă© uma linguagem compilada estaticamente e tem um papel semelhante ao C++
rustc
usa o LLVM como back-end.
- Rust suporta muitas plataformas e arquiteturas:
- x86, ARM, WebAssembly, âŠ
- Linux, Mac, Windows, âŠ
- Rust Ă© usado em uma ampla gama de dispositivos:
- firmware e carregadores de boot,
- monitores inteligentes,
- celulares,
- desktops,
- servidores.
Rust se encaixa na mesma ĂĄrea que C++:
- Alta flexibilidade.
- Alto nĂvel de controle.
- Pode ser reduzido para dispositivos com menor poder computacional, tais como microcontroladores.
- NĂŁo possui runtime ou coletor de lixo (garbage collection).
- Concentra-se em confiabilidade e segurança sem sacrificar o desempenho.
OlĂĄ Mundo!
Vamos pular para o programa em Rust mais simples possĂvel, o clĂĄssico âOlĂĄ Mundoâ:
fn main() { println!("OlĂĄ, đ!"); }
O que vocĂȘ vĂȘ:
- FunçÔes são introduzidas com
fn
. - Os blocos sĂŁo delimitados por chaves como em C e C++.
- A função
main
Ă© o ponto de entrada do programa. - Rust tem macros âhigiĂȘnicasâ,
println!
Ă© um exemplo disso. - As strings Rust sĂŁo codificadas em UTF-8 e podem conter qualquer caractere Unicode.
Este slide tenta deixar os alunos familiarizados com o cĂłdigo em Rust. Eles irĂŁo ver bastante conteĂșdo nos prĂłximos trĂȘs dias, entĂŁo começamos devagar com algo familiar.
Pontos chave:
-
Rust é muito parecido com outras linguagens na tradição C/C++/Java. à imperativo (não funcional) e não tenta reinventar as coisas, a menos que seja absolutamente necessårio.
-
Rust Ă© moderno com suporte total para coisas como Unicode.
-
Rust usa macros para situaçÔes em que vocĂȘ deseja ter um nĂșmero variĂĄvel de argumentos (sem sobrecarga de função).
-
Macros âhigiĂȘnicasâ significam que elas nĂŁo capturam acidentalmente identificadores do escopo em que sĂŁo usadas. As macros em Rust sĂŁo, na verdade, apenas parcialmente âhigiĂȘnicasâ.
-
Rust é multi-paradigma. Por exemplo, ele possui funcionalidades de programação orientada à objetos poderosas, e, embora não seja uma linguagem funcional, inclui uma série de conceitos funcionais.
Um Pequeno Exemplo
Aqui estĂĄ um pequeno programa de exemplo em Rust:
fn main() { // Ponto de entrada do programa let mut x: i32 = 6; // Atribuição de uma variĂĄvel mutĂĄvel print!("{x}"); // Macro para escrever na tela, como printf while x != 1 { // Sem parĂȘnteses ao redor de expressĂ”es if x % 2 == 0 { // MatemĂĄtica como em outras linguagens x = x / 2; } else { x = 3 * x + 1; } print!(" -> {x}"); } println!(); }
O cĂłdigo implementa a conjectura de Collatz: acredita-se que o loop sempre termina, mas isso ainda nĂŁo estĂĄ provado. Edite o cĂłdigo e tente diferentes entradas.
Pontos chave:
-
Explique que todas as variĂĄveis tipadas estaticamente. Tente remover
i32
para acionar a inferĂȘncia de tipo. Em vez disso, tente comi8
e cause um estouro de nĂșmero inteiro (integer overflow) em tempo de execução. -
Altere
let mut x
paralet x
, discuta o erro do compilador. -
Mostre como
print!
cause um erro de compilação se os argumentos não corresponderem à string de formato. -
Mostre como vocĂȘ precisa usar
{}
como um espaço reservado se quiser imprimir uma expressĂŁo que seja mais complexa do que apenas uma Ășnica variĂĄvel. -
Mostre aos alunos a biblioteca padrĂŁo (standard library), mostre como pesquisar
std::fmt
, o qual possui as regras da mini-linguagem de formatação. à importante que os alunos se familiarizem com pesquisas na biblioteca padrão.- Em um shell
rustup doc std::fmt
abrirå um navegador na documentação std::fmt local.
- Em um shell
Por que Rust?
Alguns pontos exclusivos do Rust:
- Segurança de memória em tempo de compilação.
- Sem comportamento indefinido em tempo de execução.
- Recursos de linguagem de programação modernas.
Certifique-se de perguntar Ă classe com quais linguagens de programação eles tĂȘm experiĂȘncia. Dependendo da resposta vocĂȘ pode destacar diferentes caracterĂsticas do Rust:
-
ExperiĂȘncia com C ou C++: Rust elimina toda uma classe de erros em tempo de execução atravĂ©s do verificador de emprĂ©stimos (borrow checker). VocĂȘ obtĂ©m desempenho como em C e C++, mas sem os problemas de insegurança de memĂłria. AlĂ©m disso, vocĂȘ tem uma linguagem com funcionalidades modernas como correspondĂȘncia de padrĂ”es e gerenciamento de dependĂȘncia integrado.
-
ExperiĂȘncia com Java, Go, Python, JavaScriptâŠ: VocĂȘ tem a mesma segurança de memĂłria como nessas linguagens, alĂ©m de uma semelhança com linguagens de alto nĂvel. AlĂ©m disso vocĂȘ obtĂ©m desempenho rĂĄpido e previsĂvel como C e C++ (sem coletor de lixo ou âgarbage collectorâ) bem como acesso a hardware de baixo nĂvel (caso vocĂȘ precise)
Garantias em Tempo de Compilação
Gerenciamento de memória eståtica em tempo de compilação:
- Sem variĂĄveis nĂŁo inicializadas.
- Sem vazamentos de memĂłria (quase, veja as notas).
- Sem double-frees.
- Sem use-after-free.
- Sem ponteiros
NULL
. - Sem mutexes bloqueados esquecidos.
- Sem concorrĂȘncia de dados entre threads.
- Sem invalidação de iteradores.
Ă possĂvel produzir vazamentos de memĂłria no Rust (seguro). Alguns exemplos sĂŁo:
- VocĂȘ pode usar
Box::leak
para vazar um ponteiro. Um uso para isso poderia ser para obter variĂĄveis estĂĄticas inicializadas e dimensionadas em tempo de execução - VocĂȘ pode usar
std::mem::forget
para fazer o compilador âesquecerâ sobre um valor (o que significa que o destrutor nunca Ă© executado). - VocĂȘ tambĂ©m pode criar acidentalmente uma referĂȘncia cĂclica com
Rc
ouArc
. - Na verdade, alguns considerarão que preencher infinitamente uma coleção (estruturas de dados) seja um vazamento de memória e o Rust não protege disso.
Para o propĂłsito deste curso, âSem vazamentos de memĂłriaâ deve ser entendido como âPraticamente sem vazamentos de memĂłria acidentaisâ.
Garantias em Tempo de Execução
Nenhum comportamento indefinido em tempo de execução:
- O acesso a matrizes tem limites verificados.
- Estouro de nĂșmeros inteiros Ă© definido (âpĂąnicoâ ou wrap-around).
Pontos chave:
-
O estouro de nĂșmeros inteiros Ă© definido por meio da flag
overflow-checks
em tempo de compilação. Se habilitada, o programa causarĂĄ um pĂąnico (uma falha controlada do programa). Caso contrĂĄrio, serĂĄ usada a semĂąntica wrap-around. Por padrĂŁo, vocĂȘ obtĂ©m pĂąnicos em modo de depuração (cargo build
) e wrap-around em modo de produção (cargo build --release
). -
A verificação de limites (âbounds checkingâ) nĂŁo pode ser desativada com uma flag do compilador. Ela tambĂ©m nĂŁo pode ser desativada diretamente com a palavra-chave
unsafe
. No entanto,unsafe
permite que vocĂȘ chame funçÔes comoslice::get_unchecked
que não faz verificação de limites.
Recursos Modernos
O Rust Ă© construĂdo com toda a experiĂȘncia adquirida nas Ășltimas dĂ©cadas.
CaracterĂsticas da Linguagem
- Enums e correspondĂȘncia de padrĂ”es.
- Generics.
- FFI sem overhead.
- AbstraçÔes de custo zero.
Ferramentas
- Excelentes mensagens de erro do compilador.
- Gerenciador de dependĂȘncias integrado.
- Suporte integrado para testes.
- Excelente suporte ao protocolo de servidor de linguagem (LSP).
Pontos chave:
-
AbstraçÔes de custo zero, semelhantes ao C++, significa que vocĂȘ nĂŁo precisa âpagarâ por construçÔes de programação de alto nĂvel com memĂłria ou CPU. Por exemplo, escrever um loop usando
for
deve resultar aproximadamente no mesmo nĂvel de instruçÔes de baixo nĂvel quanto usar a construção.iter().fold()
. -
Pode valer a pena mencionar que Rust enums sĂŁo âTipos de Dados AlgĂ©bricosâ (âAlgebraic Data Typesâ), tambĂ©m conhecidos como âtipos de somaâ, que permitem que o sistema de tipos expresse coisas como
Option<T>
eResult<T, E>
. -
Lembre as pessoas de lerem os erros â muitos desenvolvedores se acostumaram ignore as longas mensagens do compilador. O compilador Rust Ă© significativamente mais âverbalâ do que outros compiladores. Muitas vezes, ele lhe fornecerĂĄ sugestĂ”es prĂĄticas, prontas para copiar e colar em seu cĂłdigo.
-
A biblioteca padrĂŁo do Rust (Rust standard library) Ă© pequena comparada a linguagens como Java, Python e Go. Rust nĂŁo vem com vĂĄrias coisas que vocĂȘ pode considerar padrĂŁo e essencial:
- um gerador de nĂșmeros aleatĂłrios, mas veja rand.
- suporte para SSL ou TLS, mas consulte rusttls.
- suporte para JSON, mas consulte serde_json. O raciocĂnio por trĂĄs disso Ă© que funcionalidade na biblioteca padrĂŁo nĂŁo pode ser descartada, portanto ela tem que ser muito estĂĄvel. Para os exemplos acima, a comunidade do Rust ainda estĂĄ trabalhando para encontrar a melhor solução â e talvez nĂŁo exista uma Ășnica âmelhor soluçãoâ para algumas dessas coisas. Rust vem com um gerenciador de pacotes embutido na forma de Cargo e isso torna trivial baixar e compilar crates de terceiros. Uma consequĂȘncia disso Ă© que a biblioteca padrĂŁo pode ser menor.
Descobrir bons crates de terceiros pode ser um problema. Sites como https://lib.rs/ ajudam com isso, permitindo que vocĂȘ compare mĂ©tricas de crates para encontrar um bom e confiĂĄvel.
-
rust-analyzer é uma implementação LSP bem suportada usada pelas principais IDEs e editores de texto.
Sintaxe BĂĄsica
Grande parte da sintaxe do Rust serĂĄ familiar para vocĂȘ que vem de C, C++ ou Java:
- Blocos e escopos sĂŁo delimitados por chaves.
- ComentĂĄrios de linha sĂŁo iniciados com
//
, comentĂĄrios de bloco sĂŁo delimitados por/* ... */
. - Palavras-chave como
if
ewhile
funcionam da mesma forma. - A atribuição de variåveis é feita com
=
, a comparação é feita com==
.
Tipos Escalares
Tipos | Literais | |
---|---|---|
Inteiros com sinal | i8 , i16 , i32 , i64 , i128 , isize | -10 , 0 , 1_000 , 123_i64 |
Inteiros sem sinal | u8 , u16 , u32 , u64 , u128 , usize | 0 , 123 , 10_u16 |
NĂșmeros de ponto flutuante | f32 , f64 | 3.14 , -10.0e20 , 2_f32 |
Strings | &str | "foo" , "two\nlines" |
Valores escalares Unicode | char | 'a' , 'α' , 'â' |
Booleanos | bool | true , false |
Os tipos tĂȘm os seguintes tamanhos:
iN
,uN
efN
tĂȘm N bits,isize
eusize
sĂŁo do tamanho de um ponteiro,char
tem 32 bits,bool
tem 8 bits.
HĂĄ algumas sintaxes que nĂŁo sĂŁo mostradas acima:
-
Strings brutas permitem que vocĂȘ crie um valor
&str
com caracteres de escape desabilitados:r"\n" == "\\n"
. VocĂȘ pode embutir aspas duplas utilizando uma quantidade igual de#
em Ambos os lados das aspas:fn main() { println!(r#"<a href="link.html">link</a>"#); println!("<a href=\"link.html\">link</a>"); }
-
Strings de byte permitem que vocĂȘ crie um valor
&[u8]
diretamente:fn main() { println!("{:?}", b"abc"); println!("{:?}", &[97, 98, 99]); }
-
Todos os sublinhados em nĂșmeros podem ser omitidos, eles sĂŁo apenas para legibilidade. Por exemplo,
1_000
pode ser escrito como1000
(ou10_00
), e123_i64
pode ser escrito como123i64
.
Tipos Compostos
Tipos | Literais | |
---|---|---|
Matrizes | [T; N] | [20, 30, 40] , [0; 3] |
Tuplas | () , (T,) , (T1, T2) , ⊠| () , ('x',) , ('x', 1.2) , ⊠|
Atribuição e acesso a matrizes:
fn main() { let mut a: [i8; 10] = [42; 10]; a[5] = 0; println!("a: {:?}", a); }
Atribuição e acesso a tuplas:
fn main() { let t: (i8, bool) = (7, true); println!("1Âș Ăndice: {}", t.0); println!("2Âș Ăndice: {}", t.1); }
Pontos chave:
Vetores:
-
O valor do tipo matriz
[T; N]
comportaN
elementos (constante em tempo de compilação) do mesmo tipoN
. Note que o tamanho de uma matriz Ă© parte do seu tipo, o que significa que[u8; 3]
e[u8; 4]
sĂŁo considerados dois tipos diferentes. -
NĂłs podemos usar literais para atribuir valores para matrizes.
-
Na função
main
, o comandoprint
pede a implementação de depuração (debug) com o parùmetro de formato formato?
:{}
produz a saĂda padrĂŁo,{:?}
produz a saĂda de depuração. NĂłs tambĂ©m poderĂamos ter usado{a}
e{a:?}
sem especificar o valor depois da string de formato. -
Adicionando
#
, p.ex.{a:#?}
, invoca um formato âpretty printingâ (âimpressĂŁo bonitaâ), que pode ser mais legĂvel.
Tuplas:
-
Assim como matrizes, tuplas tĂȘm tamanho fixo.
-
Tuplas agrupam valores de diferentes tipos em um tipo composto.
-
Campos de uma tupla podem ser acessados com um ponto e o Ăndice do valor, e.g.
t.0
,t.1
. -
A tupla vazia
()
tambĂ©m Ă© conhecida como âtipo unidadeâ (unit type). Ă tanto um tipo quanto o Ășnico valor vĂĄlido desse tipo - ou seja, o tipo e seu valor sĂŁo expressos como()
. Ă usado para indicar, por exemplo, que uma função ou expressĂŁo nĂŁo tem valor de retorno, como veremos em um slide futuro.- VocĂȘ pode pensar nisso como um
void
, que talvez lhe seja familiar de outras linguagens de programação.
- VocĂȘ pode pensar nisso como um
ReferĂȘncias
Como C++, o Rust tem referĂȘncias:
fn main() { let mut x: i32 = 10; let ref_x: &mut i32 = &mut x; *ref_x = 20; println!("x: {x}"); }
Algumas notas:
- Devemos desreferenciar
ref_x
ao atribuĂ-lo um valor, semelhante Ă ponteiros em C e C++. - Em alguns casos, o Rust desreferenciarĂĄ automaticamente, em particular ao invocar mĂ©todos (tente
ref_x.count_ones()
). - As referĂȘncias que sĂŁo declaradas como
mut
podem ser vinculadas a diferentes valores ao longo de seu tempo de vida.
Pontos chave:
- Certifique-se de observar a diferença entre
let mut ref_x: &i32
elet ref_x: &mut i32
. O primeiro representa uma referĂȘncia mutĂĄvel que pode ser ligada a diferentes valores, enquanto o segundo representa uma referĂȘncia a um valor mutĂĄvel.
ReferĂȘncias Soltas
Rust estaticamente proibirĂĄ referĂȘncias pendentes:
fn main() { let ref_x: &i32; { let x: i32 = 10; ref_x = &x; } println!("ref_x: {ref_x}"); }
- Diz-se que uma referĂȘncia âpega emprestadoâ o valor a que se refere.
- Rust estĂĄ rastreando os tempos de vida de todas as referĂȘncias para garantir que elas durem o suficiente.
- Falaremos mais sobre empréstimos quando chegarmos à ownership.
Slices
Uma slice (fatia) oferece uma visão de uma coleção maior:
fn main() { let mut a: [i32; 6] = [10, 20, 30, 40, 50, 60]; println!("a: {a:?}"); let s: &[i32] = &a[2..4]; println!("s: {s:?}"); }
- Slices pegam dados emprestados do tipo original.
- Pergunta: O que acontece se vocĂȘ modificar
a[3]
imediatamente antes de imprimirs
?
-
NĂłs criamos uma slice emprestando
a
e especificando os Ăndices de inĂcio e fim entre colchetes. -
Se a slice começa no Ăndice 0, a sintaxe de range (faixa) nos permite omitir o Ăndice inicial, o que significa que
&a[0..a.len()]
e&a[..a.len()]
sĂŁo idĂȘnticos. -
O mesmo vale para o Ășltimo Ăndice, logo
&a[2..a.len()]
e&a[2..]
sĂŁo idĂȘnticos. -
Para criar facilmente uma slice de uma matriz completa, podemos utilizar
&a[..]
. -
s
Ă© uma referĂȘncia a uma slice dei32
. Observe que o tipo des
(&[i32]
) nĂŁo menciona mais o tamanho da matriz. Isso nos permite realizar cĂĄlculos em slices de tamanhos diferentes. -
As slices sempre pegam emprestado de outro objeto. Neste exemplo,
a
deve permanecer âvivoâ (em escopo) por pelo menos tanto tempo quanto nossa slice. -
A questão sobre a modificação de
a[3]
pode gerar uma discussĂŁo interessante, mas a resposta Ă© que por motivos de segurança de memĂłria vocĂȘ nĂŁo pode fazer isso por meio dea
neste ponto durante a execução, mas vocĂȘ pode ler os dados dea
es
com segurança. Isto funciona antes da criação do slice, e novamente depois deprintln
, quando o slice não é mais necessårio. Mais detalhes serão explicados na seção do verificador de empréstimos.
String
vs str
Agora podemos entender os dois tipos de strings em Rust:
fn main() { let s1: &str = "Mundo"; println!("s1: {s1}"); let mut s2: String = String::from("OlĂĄ "); println!("s2: {s2}"); s2.push_str(s1); println!("s2: {s2}"); let s3: &str = &s2[6..]; println!("s3: {s3}"); }
Terminologia do Rust:
&str
Ă© uma referĂȘncia imutĂĄvel para uma slice de string.String
Ă© um buffer de string mutĂĄvel.
-
&str
introduz uma slice de string, a qual Ă© uma referĂȘncia imutĂĄvel para os dados da string em formato UTF-8 armazenados em um bloco de memĂłria. Literais de string ("Hello"
) sĂŁo armazenadas no cĂłdigo binĂĄrio do programa. -
O tipo
String
do Rust Ă© um invĂłlucro ao redor de uma matriz de bytes. Assim como umVec<T>
, ele Ă© owned. -
Da mesma forma que outros tipos,
String::from()
cria uma string a partir de um literal;String::new()
cria uma nova string vazia, na qual dados de string podem ser adicionados com os métodospush()
epush_str()
. -
A macro
format!()
Ă© uma maneira conveniente de gerar uma string owned a partir de valores dinĂąmicos. Ela aceita os mesmos formatadores queprintln!()
. -
VocĂȘ pode emprestar slices
&str
deString
através do operador&
e, opcionalmente, selecionar um range (âintervaloâ). -
Para programadores C++: pense em
&str
comoconst char*
de C++, mas que sempre aponta para uma string vĂĄlida na memĂłria. Em Rust,String
Ă© um equivalente aproximado destd::string
de C++ (principal diferença: ele só pode conter bytes codificados em UTF-8 e nunca usarå uma otimização de string pequena).
FunçÔes
Uma versĂŁo em Rust da famosa pergunta de entrevistas FizzBuzz:
fn main() { print_fizzbuzz_to(20); } fn is_divisible(n: u32, divisor: u32) -> bool { if divisor == 0 { return false; } n % divisor == 0 } fn fizzbuzz(n: u32) -> String { let fizz = if is_divisible(n, 3) { "fizz" } else { "" }; let buzz = if is_divisible(n, 5) { "buzz" } else { "" }; if fizz.is_empty() && buzz.is_empty() { return format!("{n}"); } format!("{fizz}{buzz}") } fn print_fizzbuzz_to(n: u32) { for i in 1..=n { println!("{}", fizzbuzz(i)); } }
- Nos referimos em
main
a uma função escrita abaixo. Nem declaraçÔes prévias e nem cabeçalhos são necessårios. - Os parùmetros de declaração são seguidos por um tipo (o inverso de algumas linguagens de programação) e, em seguida, um tipo de retorno.
- A Ășltima expressĂŁo em um corpo de uma função (ou qualquer bloco) torna-se o valor de retorno. Simplesmente omita o
;
no final da expressĂŁo. - Algumas funçÔes nĂŁo tĂȘm valor de retorno e retornam o âtipo unitĂĄrioâ,
()
. O compilador irĂĄ inferir isso se o tipo de retorno-> ()
for omitido. - A expressĂŁo de intervalo no loop
for
emimprimir_fizzbuzz_para()
contém=n
, o que faz com que inclua o limite superior.
Rustdoc
Todos os itens da linguagem podem ser documentados com a sintaxe especial ///
.
/// Determine se o primeiro argumento Ă© divisĂvel pelo segundo argumento. /// /// Se o segundo argumento for zero, o resultado Ă© falso. fn is_divisible_by(lhs: u32, rhs: u32) -> bool { if rhs == 0 { return false; // Caso excepcional, retorne antes } lhs % rhs == 0 // A Ășltima expressĂŁo do bloco Ă© o valor de retorno }
O conteĂșdio Ă© tratado como Markdown. Todos os crates publicados na biblioteca Rust sĂŁo documentados automaticamente em docs.rs
utilizando a ferramenta rustdoc. Ă idiomĂĄtico documentar todos os itens pĂșblicos em uma API usando este padrĂŁo.
-
Mostre aos alunos os documentos gerados para o crate
rand
emdocs.rs/rand
. -
Este curso não inclui o rustdoc nos slides, apenas para economizar espaço, mas em código real eles devem estar presentes.
-
Os comentĂĄrios internos do documento sĂŁo discutidos posteriormente (na pĂĄgina sobre mĂłdulos) e nĂŁo precisam ser ser abordados aqui.
-
Os comentĂĄrios do Rustdoc podem conter trechos de cĂłdigo-fonte, que podem ser executados e testados por meio de
cargo test
. Nós discutiremos estes testes na seção de Testes.
MĂ©todos
MĂ©todos sĂŁo funçÔes associadas a um tipo especĂfico. O primeiro argumento (self
) de um método é uma instùncia do tipo ao qual estå associado:
struct Rectangle { width: u32, height: u32, } impl Rectangle { fn area(&self) -> u32 { self.width * self.height } fn inc_width(&mut self, delta: u32) { self.width += delta; } } fn main() { let mut rect = Rectangle { width: 10, height: 5 }; println!("area antiga: {}", rect.area()); rect.inc_width(5); println!("nova area: {}", rect.area()); }
- Veremos muito mais sobre mĂ©todos no exercĂcio de hoje e na aula de amanhĂŁ.
-
Add a static method called
Rectangle::new
and call this frommain
:fn new(width: u32, height: u32) -> Rectangle { Rectangle { width, height } }
-
While technically, Rust does not have custom constructors, static methods are commonly used to initialize structs (but donât have to). The actual constructor,
Rectangle { width, height }
, could be called directly. See the Rustnomicon. -
Add a
Rectangle::square(width: u32)
constructor to illustrate that such static methods can take arbitrary parameters.
Sobrecarga de FunçÔes
Sobrecarga nĂŁo Ă© suportada:
- Cada função tem uma Ășnica implementação:
- Sempre tem um nĂșmero fixo de parĂąmetros.
- Sempre usa um Ășnico conjunto de tipos de parĂąmetros.
- Valores padrĂŁo nĂŁo sĂŁo suportados:
- Todos as chamadas tĂȘm o mesmo nĂșmero de argumentos.
- Ăs vezes macros sĂŁo utilizadas como alternativa.
No entanto, os parùmetros da função podem ser tipos genéricos:
fn pick_one<T>(a: T, b: T) -> T { if std::process::id() % 2 == 0 { a } else { b } } fn main() { println!("lance da moeda: {}", pick_one("cara", "coroa")); println!("prĂȘmio em dinheiro: {}", pick_one(500, 1000)); }
- Ao usar tipos genéricos, o
Into<T>
da biblioteca padrão pode fornecer um tipo de polimorfismo limitado nos tipos de argumento. Veremos mais detalhes em uma seção posterior.
Dia 1: ExercĂcios Matinais
Nestes exercĂcios, vamos explorar duas partes do Rust:
-
ConversĂ”es implĂcitas entre tipos.
-
Matrizes (Arrays) e loops (laços)
for
.
Algumas coisas a considerar ao resolver os exercĂcios:
-
Se possĂvel, use uma instalação local do Rust. Desta forma, vocĂȘ pode obter preenchimento automĂĄtico em seu editor. Veja a pĂĄgina sobre Utilização do Cargo para detalhes sobre instalação do Rust.
-
Alternativamente, utilize o Rust Playground.
Os trechos de cĂłdigo nĂŁo sĂŁo editĂĄveis de propĂłsito: os trechos de cĂłdigo embutidos perdem seu estado se vocĂȘ sair da pĂĄgina.
Depois de ver os exercĂcios, vocĂȘ pode ver as soluçÔes fornecidas.
ConversĂ”es ImplĂcitas
Rust nĂŁo aplicarĂĄ automaticamente conversĂ”es implĂcitas entre os tipos (ao contrĂĄrio de C++). VocĂȘ pode ver isso em um programa como este:
fn multiply(x: i16, y: i16) -> i16 { x * y } fn main() { let x: i8 = 15; let y: i16 = 1000; println!("{x} * {y} = {}", multiply(x, y)); }
Todos os tipos inteiros do Rust implementam os traits From<T>
e Into<T>
para nos deixar converter entre eles. O trait From<T>
tem um Ășnico mĂ©todo from()
e da mesma forma, o trait Into<T>
tem um Ășnico mĂ©todo into()
. A implementação desses traits é como um tipo expressa que pode ser convertido em outro tipo.
A biblioteca padrão tem uma implementação de From<i8> for i16
, o que significa que podemos converter uma variĂĄvel x
do tipo i8
para um i16
chamando i16::from(x)
. Ou, mais simples, com x.into()
, porque a implementação From<i8> for i16
cria automaticamente uma implementação de Into<i16> for i8
.
O mesmo se aplica às suas próprias implementaçÔes de From
para seus prĂłprios tipos, logo Ă© suficiente implementar apenas From
para obter uma respectiva implementação Into
automaticamente.
-
Execute o programa acima e observe o erro de compilação.
-
Atualize o cĂłdigo acima para utilizar
into()
para fazer a conversĂŁo. -
Mude os tipos de
x
ey
para outros tipos (comof32
,bool
,i128
) para ver quais tipos vocĂȘ pode converter para quais outros tipos. Experimente converter tipos pequenos em tipos grandes e vice-versa. Verifique a documentação da biblioteca padrĂŁo para ver seFrom<T>
estĂĄ implementado para os pares que vocĂȘ verificar.
Matrizes (Arrays) e Loops (Laços) for
Vimos que uma matriz pode ser declarada assim:
#![allow(unused)] fn main() { let array = [10, 20, 30]; }
VocĂȘ pode imprimir tal matriz solicitando sua representação de depuração com {:?}
:
fn main() { let array = [10, 20, 30]; println!("matriz: {array:?}"); }
Rust permite iterar em coisas como matrizes e ranges (faixas ou intervalos) usando a palavra-chave for
:
fn main() { let array = [10, 20, 30]; print!("Iterando sobre a matriz:"); for n in &array { print!(" {n}"); } println!(); print!("Iterando sobre um range:"); for i in 0..3 { print!(" {}", array[i]); } println!(); }
Use o exercĂcio acima para escrever uma função pretty_print
que imprime uma matriz e uma função transpose
que irĂĄ transpor uma matriz (transformar linhas em colunas):
Limite ambas as funçÔes a operar em matrizes 3 à 3.
Copie o código abaixo para https://play.rust-lang.org/ e implemente as funçÔes:
// TODO: remova isto quando vocĂȘ terminar sua implementação . #![allow(unused_variables, dead_code)] fn transpose(matrix: [[i32; 3]; 3]) -> [[i32; 3]; 3] { unimplemented!() } fn pretty_print(matrix: &[[i32; 3]; 3]) { unimplemented!() } fn main() { let matrix = [ [101, 102, 103], // <-- o comentĂĄrio faz com que o rustfmt adicione uma nova linha [201, 202, 203], [301, 302, 303], ]; println!("matriz:"); pretty_print(&matrix); let transposed = transpose(matrix); println!("transposta:"); pretty_print(&transposed); }
Pergunta BĂŽnus
VocĂȘ poderia usar slices &[i32]
em vez de matrizes 3 Ă 3 fixas no cĂłdigo para o seu argumento e tipos de retorno? Algo como &[&[i32]]
para um slice-de-slices bidimensional. Por que sim ou por que nĂŁo?
Veja o crate ndarray
para uma implementação de produção.
A solução e a resposta para a seção de bĂŽnus estĂŁo disponĂveis na Seção SoluçÔes.
O uso da referĂȘncia &matriz
em for n in &matriz
é uma prévia sutil das questÔes de propriedade que surgirão à tarde.
Sem o &
âŠ
- O loop teria sido o que consome a matriz. Esta é uma mudança introduzida na Edição de 2021.
- Uma cĂłpia implĂcita da matriz teria ocorrido. Como
i32
Ă© um tipo de cĂłpia (copy type), entĂŁo[i32; 3]
também é um tipo de cópia.
Controle de Fluxo
Como vimos, if
Ă© uma expressĂŁo em Rust. Ă usado para avaliar condicionalmente um de dois blocos, mas os blocos podem ter um valor que entĂŁo se torna o valor da expressĂŁo if
. Outras expressÔes de controle de fluxo funcionam de forma semelhante em Rust.
Blocos
Um bloco em Rust contĂȘm uma sequĂȘncia de expressĂ”es. Cada bloco tem um valor e um tipo, os quais sĂŁo os da Ășltima expressĂŁo do bloco:
fn main() { let x = { let y = 10; println!("y: {y}"); let z = { let w = { 3 + 4 }; println!("w: {w}"); y * w }; println!("z: {z}"); z - y }; println!("x: {x}"); }
Se a Ășltima expressĂŁo terminar com ;
, o valor resultante e o tipo serĂĄ ()
.
A mesma regra é usada para funçÔes: o valor do corpo da função é o valor de retorno:
fn double(x: i32) -> i32 { x + x } fn main() { println!("dobrado: {}", double(7)); }
Pontos Chave:
- O objetivo deste slide Ă© mostrar que os blocos tĂȘm um tipo e um valor em Rust.
- VocĂȘ pode mostrar como o valor do bloco muda alterando a Ășltima linha do bloco. Por exemplo, adicionar/remover um ponto e vĂrgula (
;
) ou usar umreturn
.
ExpressÔes if
VocĂȘ usa expressĂ”es if
exatamente como declaraçÔes if
em outras linguagens:
fn main() { let mut x = 10; if x % 2 == 0 { x = x / 2; } else { x = 3 * x + 1; } }
AlĂ©m disso, vocĂȘ pode usĂĄ-lo como uma expressĂŁo. A Ășltima expressĂŁo de cada bloco se torna o valor da expressĂŁo if
fn main() { let mut x = 10; x = if x % 2 == 0 { x / 2 } else { 3 * x + 1 }; }
Como if
Ă© uma expressĂŁo e deve ter um tipo especĂfico, ambos os blocos de ramificação devem ter o mesmo tipo. Considere mostrar o que acontece se vocĂȘ adicionar um ;
depois de x / 2
no segundo exemplo.
Loops (Laços) for
O loop for
estĂĄ intimamente relacionado com o loop while let
. Ele chamarĂĄ automaticamente into_iter()
na expressĂŁo e, em seguida, iterarĂĄ sobre ela:
fn main() { let v = vec![10, 20, 30]; for x in v { println!("x: {x}"); } for i in (0..10).step_by(2) { println!("i: {i}"); } }
Aqui vocĂȘ pode usar break
e continue
como de costume.
- A iteração de Ăndice nĂŁo Ă© uma sintaxe especial no Rust apenas para esse caso.
(0..10)
Ă© um range (intervalo) que implementa um traitIterator
.step_by
é um método que retorna outroIterator
que pula outros elementos alternadamente.- Modifique os elementos no vetor e explique os erros de compilação. Altere o vetor
v
para ser mutĂĄvel e o loopfor
parafor x in v.iter_mut()
.
Loops (Laços) while
A palavra-chave while
funciona de maneira muito similar a outras linguagens:
fn main() { let mut x = 10; while x != 1 { x = if x % 2 == 0 { x / 2 } else { 3 * x + 1 }; } println!("X final: {x}"); }
break
e continue
- Se vocĂȘ quiser sair de um loop cedo, use
break
, - Se vocĂȘ quiser iniciar imediatamente a prĂłxima iteração use
continue
.
Ambos continue
e break
podem opcionalmente receber um label (rĂłtulo) como argumento que Ă© usado para sair de loops aninhados:
fn main() { let v = vec![10, 20, 30]; let mut iter = v.into_iter(); 'outer: while let Some(x) = iter.next() { println!("x: {x}"); let mut i = 0; while i < x { println!("x: {x}, i: {i}"); i += 1; if i == 3 { break 'outer; } } } }
Neste caso, paramos o loop externo após 3 iteraçÔes do loop interno.
ExpressÔes loop
Finalmente, hĂĄ uma palavra-chave loop
que cria um loop infinito.
Aqui vocĂȘ deve usar break
ou return
para parar o loop:
fn main() { let mut x = 10; loop { x = if x % 2 == 0 { x / 2 } else { 3 * x + 1 }; if x == 1 { break; } } println!("X final: {x}"); }
- Interrompa o
loop
com um valor (por exemplo,break 8
) e imprima-o. - Observe que
loop
Ă© a Ășnica construção de loop que retorna um valor nĂŁo trivial . Isso ocorre porque Ă© garantido que ele serĂĄ executado pelo menos uma vez (diferente de loopswhile
efor
).
VariĂĄveis
Rust fornece segurança de tipo por meio de tipagem eståtica. Variåveis são imutåveis por padrão:
fn main() { let x: i32 = 10; println!("x: {x}"); // x = 20; // println!("x: {x}"); }
- Devido Ă inferĂȘncia de tipos, o
i32
Ă© opcional. Gradualmente mostraremos os tipos cada vez menos Ă medida que o curso progride.
InferĂȘncia de Tipo
Rust verĂĄ como a variĂĄvel Ă© usada para determinar o tipo:
fn takes_u32(x: u32) { println!("u32: {x}"); } fn takes_i8(y: i8) { println!("i8: {y}"); } fn main() { let x = 10; let y = 20; takes_u32(x); takes_i8(y); // recebe_u32(y); }
Este slide demonstra como o compilador Rust infere tipos com base em restriçÔes dadas por declaraçÔes e usos de variåveis.
Ă muito importante enfatizar que variĂĄveis declaradas assim nĂŁo sĂŁo de um tipo dinĂąmico âqualquer tipoâ que possa armazenar quaisquer dados. O cĂłdigo de mĂĄquina gerado por tal declaração Ă© idĂȘntico Ă declaração explĂcita de um tipo. O compilador faz o trabalho para nĂłs e nos ajuda a escrever um cĂłdigo mais conciso.
O cĂłdigo a seguir informa ao compilador para copiar para um determinado contĂȘiner genĂ©rico sem que o cĂłdigo especifique explicitamente o tipo contido, usando _
como placeholder:
fn main() { let mut v = Vec::new(); v.push((10, false)); v.push((20, true)); println!("v: {v:?}"); let vv = v.iter().collect::<std::collections::HashSet<_>>(); println!("vv: {vv:?}"); }
collect
depende de FromIterator
, que HashSet
implementa.
VariĂĄveis EstĂĄticas e Constantes
Variåveis eståticas e constantes são duas maneiras diferentes de criar valores com escopo global que não podem ser movidos ou realocados durante a execução do programa.
const
Constantes são avaliadas em tempo de compilação e seus valores são incorporados onde quer que sejam usados:
const DIGEST_SIZE: usize = 3; const ZERO: Option<u8> = Some(42); fn compute_digest(text: &str) -> [u8; DIGEST_SIZE] { let mut digest = [ZERO.unwrap_or(0); DIGEST_SIZE]; for (idx, &b) in text.as_bytes().iter().enumerate() { digest[idx % DIGEST_SIZE] = digest[idx % DIGEST_SIZE].wrapping_add(b); } digest } fn main() { let digest = compute_digest("OlĂĄ"); println!("Resumo: {digest:?}"); }
De acordo com o Rust RFC Book, eles sĂŁo expandidos no prĂłprio local (inline) quando utilizados.
Somente funçÔes marcadas como const
podem ser chamadas em tempo de compilação para gerar valores const
. As funçÔes const
podem, entretanto, ser chamadas em tempo de execução.
static
Variåveis eståticas permanecerão vålidas durante toda a execução do programa e, portanto, não serão movidas:
static BANNER: &str = "Bem-vindo ao RustOS 3.14"; fn main() { println!("{BANNER}"); }
Conforme observado no Rust RFC Book, eles nĂŁo sĂŁo expandidos no local (inlined) quando utilizados e possuem um local de memĂłria real associado. Isso Ă© Ăștil para cĂłdigo inseguro (unsafe) e embarcado, e a variĂĄvel Ă© vĂĄlida durante toda a execução do programa. Quando um valor de escopo global nĂŁo tem uma razĂŁo para precisar de identidade de objeto, geralmente const
Ă© preferido.
Como variĂĄveis estĂĄticas (static
) sĂŁo acessĂveis de qualquer thread, elas precisam ser Sync
. A mutabilidade interior Ă© possĂvel atravĂ©s de um Mutex
, atĂŽmico ou similar. TambĂ©m Ă© possĂvel ter variĂĄveis estĂĄticas mutĂĄveis, mas elas exigem sincronização manual de forma que qualquer acesso a elas requer cĂłdigo âinseguroâ. Veremos variĂĄveis estĂĄticas mutĂĄveis no capĂtulo sobre Unsafe Rust.
- Mencione que
const
se comporta semanticamente de maneira similar aoconstexpr
de C++. - Por outro lado,
static
Ă© muito mais similar a umconst
ou variĂĄvel global mutĂĄvel em C++. static
fornece identidade de objeto: um endereço na memória e estado conforme exigido por tipos com mutabilidade interior tais comoMutex<T>
.- NĂŁo Ă© muito comum que alguĂ©m precise de uma constante avaliada em tempo de execução, mas Ă© Ăștil e mais seguro do que usar uma variĂĄvel estĂĄtica.
- Dados de
thread_local
podem ser criados com a macrostd::thread_local
.
Tabela de propriedades:
Propriedade | Static | Constant |
---|---|---|
Possui um endereço na memória | Sim | Não (inlined, i.e., expandida no local) |
à vålida durante toda a execução do programa | Sim | Não |
Pode ser mutĂĄvel | Sim (inseguro) | NĂŁo |
Avaliada em tempo de compilação | Sim (inicializada em tempo de compilação) | Sim |
Inlined (expandida no local) onde quer que seja utilizada | NĂŁo | Sim |
Escopos e Sobreposição
VocĂȘ pode sobrepor (shadow) variĂĄveis, tanto aquelas de escopos externos quanto variĂĄveis do mesmo escopo:
fn main() { let a = 10; println!("antes: {a}"); { let a = "olĂĄ"; println!("escopo interno: {a}"); let a = true; println!("sobreposto no escopo interno: {a}"); } println!("depois: {a}"); }
- Definição: Shadowing Ă© diferente da mutação, porque apĂłs a sobreposição (shadowing), os locais de memĂłria de ambas as variĂĄveis existem ao mesmo tempo. Ambas estĂŁo disponĂveis com o mesmo nome, dependendo de onde vocĂȘ as usa no cĂłdigo.
- Uma variĂĄvel sobreposta pode ter um tipo diferente.
- A sobreposição parece obscura a princĂpio, mas Ă© conveniente para manter os valores apĂłs
.unwrap()
. - O cĂłdigo a seguir demonstra por que o compilador nĂŁo pode simplesmente reutilizar locais de memĂłria ao sobrepor uma variĂĄvel imutĂĄvel em um escopo, mesmo que o tipo nĂŁo seja alterado.
fn main() { let a = 1; let b = &a; let a = a + 1; println!("{a} {b}"); }
Enums
A palavra-chave enum
permite a criação de um tipo que possui algumas variantes diferentes:
fn generate_random_number() -> i32 { // Implementação baseada em https://xkcd.com/221/ 4 // Escolhido por uma rolagem de dados justa. Garantido ser aleatĂłrio. } #[derive(Debug)] enum CoinFlip { Heads, Tails, } fn flip_coin() -> CoinFlip { let random_number = generate_random_number(); if random_number % 2 == 0 { return CoinFlip::Heads; } else { return CoinFlip::Tails; } } fn main() { println!("VocĂȘ tirou: {:?}", flip_coin()); }
Pontos Chave:
- EnumeraçÔes permitem coletar um conjunto de valores em um tipo
- Esta pĂĄgina oferece um tipo de enum
MoedaJogada
com duas variantesCara
eCoroa
. VocĂȘ pode observar o namespace ao usar variantes. - Este pode ser um bom momento para comparar Structs e Enums:
- Em ambos, vocĂȘ pode ter uma versĂŁo simples sem campos (unit struct, ou estrutura unitĂĄria) ou uma com diferentes tipos de campo.
- Em ambos, as funçÔes associadas são definidas dentro de um bloco
impl
. - VocĂȘ pode atĂ© mesmo implementar as diferentes variantes de uma Enum com Structs separadas, mas elas nĂŁo seriam do mesmo tipo, como seriam se todas fossem definidas em uma Enum.
ConteĂșdos Variantes
VocĂȘ pode definir enums mais ricos onde as variantes carregam dados. VocĂȘ pode entĂŁo usar a instrução match
(corresponder) para extrair os dados de cada variante:
enum WebEvent { PageLoad, // Variante sem conteĂșdo KeyPress(char), // Variante tupla Click { x: i64, y: i64 }, // Variante completa } #[rustfmt::skip] fn inspect(event: WebEvent) { match event { WebEvent::PageLoad => println!("pĂĄgina carregada"), WebEvent::KeyPress(c) => println!("pressionou '{c}'"), WebEvent::Click { x, y } => println!("clicou em x={x}, y={y}"), } } fn main() { let load = WebEvent::PageLoad; let press = WebEvent::KeyPress('x'); let click = WebEvent::Click { x: 20, y: 80 }; inspect(load); inspect(press); inspect(click); }
- Os valores nas variantes de uma enum sĂł podem ser acessados apĂłs uma correspondĂȘncia de padrĂŁo. O padrĂŁo vincula referĂȘncias aos campos no âbraçoâ do match apĂłs
=>
.- A expressão é comparada com os padrÔes de cima a baixo. Não existe fall-through como em C ou C++.
- A expressĂŁo match possui um valor. O valor Ă© o da Ășltima expressĂŁo executada em um âbraçoâ do match.
- Começando do topo, nĂłs procuramos qual padrĂŁo corresponde ao valor, e entĂŁo executamos o cĂłdigo apĂłs a flecha. Quando uma correspondĂȘncia Ă© encontrada, nĂłs paramos.
- Demonstre o que acontece quando a busca nĂŁo abrange todas as possibilidades. Mencione a vantagem que o compilador do Rust oferece confirmando quando todos os casos foram tratados.
match
inspeciona um campo discriminant escondido naenum
.- Ă possĂvel recuperar o discriminante chamando
std::mem::discriminant()
- Isso Ă© Ăștil, por exemplo, ao implementar
PartialEq
para structs nas quais comparar valores de campos nĂŁo afeta a igualdade.
- Isso Ă© Ăștil, por exemplo, ao implementar
WebEvent::Click { ... }
nĂŁo Ă© exatamente o mesmo queWebEvent::Click(Click)
com umastruct Click { ... }
top-level. A versĂŁo no prĂłprio local (inline) nĂŁo permite implementar traits, por exemplo.
Tamanhos de Enum
Enums, em Rust, são agrupados de maneira compacta, levando em consideração restriçÔes devido ao alinhamento:
use std::any::type_name; use std::mem::{align_of, size_of}; fn dbg_size<T>() { println!("{}: tamanho {} bytes, alinhamento: {} bytes", type_name::<T>(), size_of::<T>(), align_of::<T>()); } enum Foo { A, B, } fn main() { dbg_size::<Foo>(); }
- Consulte a ReferĂȘncia do Rust.
Pontos Chave:
-
Internamente Rust utiliza um campo (discriminante) para saber qual a variante da enum.
-
Ă possĂvel controlar a discriminante se necessĂĄrio (e.g., para compatibilidade com C):
#[repr(u32)] enum Bar { A, // 0 B = 10000, C, // 10001 } fn main() { println!("A: {}", Bar::A as u32); println!("B: {}", Bar::B as u32); println!("C: {}", Bar::C as u32); }
Sem
repr
, o tipo da discriminante usa 2 bytes, porque 10001 cabe em 2 bytes. -
Tente outros tipos como
dbg_size!(bool)
: tamanho 1 bytes, alinhamento: 1 bytes,dbg_size!(Option<bool>)
: tamanho 1 bytes, alinhamento: 1 bytes (otimização de nicho, seja abaixo),dbg_size!(&i32)
: tamanho 8 bytes, alinhamento: 8 bytes (em uma mĂĄquina de 64-bits),dbg_size!(Option<&i32>)
: tamanho 8 bytes, alinhamento: 8 bytes (otimização de ponteiro nulo, veja abaixo).
-
Otimização de nicho: Rust vai mesclar padrÔes de bits não utilizados na discriminante da enum.
-
Otimização de ponteiro nulo: para alguns tipos, o Rust garante que
size_of::<T>()
se igualasize_of::<Option<T>>()
.Código de exemplo caso queira mostrar como a representação em bits pode ser na pråtica. à importante apontar que o compilador não oferece nenhuma garantia a respeito dessa representação, portanto isso é completamente inseguro.
use std::mem::transmute; macro_rules! dbg_bits { ($e:expr, $bit_type:ty) => { println!("- {}: {:#x}", stringify!($e), transmute::<_, $bit_type>($e)); }; } fn main() { // TOTALLY UNSAFE. Rust provides no guarantees about the bitwise // representation of types. unsafe { println!("Representação em bits de booleano"); dbg_bits!(false, u8); dbg_bits!(true, u8); println!("Representação em bits de Option<bool>"); dbg_bits!(None::<bool>, u8); dbg_bits!(Some(false), u8); dbg_bits!(Some(true), u8); println!("Representação em bits de Option<Option<bool>>"); dbg_bits!(Some(Some(false)), u8); dbg_bits!(Some(Some(true)), u8); dbg_bits!(Some(None::<bool>), u8); dbg_bits!(None::<Option<bool>>, u8); println!("Representação em bits de Option<&i32>"); dbg_bits!(None::<&i32>, usize); dbg_bits!(Some(&0i32), usize); } }
Exemplo mais complexo caso queira demonstrar o que acontece ao encadear mais de 256
Option
s de uma vez.#![recursion_limit = "1000"] use std::mem::transmute; macro_rules! dbg_bits { ($e:expr, $bit_type:ty) => { println!("- {}: {:#x}", stringify!($e), transmute::<_, $bit_type>($e)); }; } // Macro to wrap a value in 2^n Some() where n is the number of "@" signs. // Increasing the recursion limit is required to evaluate this macro. macro_rules! many_options { ($value:expr) => { Some($value) }; ($value:expr, @) => { Some(Some($value)) }; ($value:expr, @ $($more:tt)+) => { many_options!(many_options!($value, $($more)+), $($more)+) }; } fn main() { // TOTALLY UNSAFE. Rust provides no guarantees about the bitwise // representation of types. unsafe { assert_eq!(many_options!(false), Some(false)); assert_eq!(many_options!(false, @), Some(Some(false))); assert_eq!(many_options!(false, @@), Some(Some(Some(Some(false))))); println!("Representação em bits de uma sequĂȘncia de 128 Option's."); dbg_bits!(many_options!(false, @@@@@@@), u8); dbg_bits!(many_options!(true, @@@@@@@), u8); println!("Representação em bits de uma sequĂȘncia de 256 Option's."); dbg_bits!(many_options!(false, @@@@@@@@), u16); dbg_bits!(many_options!(true, @@@@@@@@), u16); println!("Representação em bits de uma sequĂȘncia de 257 Option's."); dbg_bits!(many_options!(Some(false), @@@@@@@@), u16); dbg_bits!(many_options!(Some(true), @@@@@@@@), u16); dbg_bits!(many_options!(None::<bool>, @@@@@@@@), u16); } }
Novel Control Flow
Rust has a few control flow constructs which differ from other languages. They are used for pattern matching:
- ExpressÔes
if let
while let
expressions- ExpressÔes
match
(CorrespondĂȘncia)
ExpressÔes if let
A expressĂŁo if let
lhe permite que vocĂȘ execute um cĂłdigo diferente, dependendo se um valor corresponde a um padrĂŁo:
fn main() { let arg = std::env::args().next(); if let Some(value) = arg { println!("Nome do programa: {value}"); } else { println!("Falta o nome?"); } }
Consulte correspondĂȘncia de padrĂ”es (pattern matching) para obter mais detalhes sobre padrĂ”es em Rust.
-
Ao contrĂĄrio de
match
,if let
não precisa cobrir todas as ramificaçÔes. Isso pode tornå-lo mais conciso do quematch
. -
Um uso comum Ă© lidar com valores
Some
ao trabalhar comOption
. -
Ao contrĂĄrio de
match
,if let
nĂŁo suporta clĂĄusulas de guarda para correspondĂȘncia de padrĂ”es. -
Desde 1.65, uma construção let-else semelhante permite fazer uma atribuição de desestruturação, ou se falhar, ter um bloco de ramificação sem retorno (
panic
/return
/break
/continue
):fn main() { println!("{:?}", second_word_to_upper("foo bar")); } fn second_word_to_upper(s: &str) -> Option<String> { let mut it = s.split(' '); let (Some(_), Some(item)) = (it.next(), it.next()) else { return None; }; Some(item.to_uppercase()) }
Loops (Laços) while let
Similar a if let
, hĂĄ uma variante while let
que testa repetidamente se um valor corresponde a um padrĂŁo:
fn main() { let v = vec![10, 20, 30]; let mut iter = v.into_iter(); while let Some(x) = iter.next() { println!("x: {x}"); } }
Aqui o iterador retornado por v.into_iter()
retornarĂĄ uma Option<i32>
em cada chamada para next()
. Ele retorna Some(x)
atĂ© que seja concluĂdo e, em seguida, retorna None
. O while let
nos permite continuar iterando por todos os itens.
Consulte correspondĂȘncia de padrĂ”es (pattern matching) para obter mais detalhes sobre padrĂ”es em Rust.
- Ressalte que o loop
while let
continuarĂĄ executando enquanto o valor corresponder ao padrĂŁo. - VocĂȘ pode reescrever o loop
while let
como um loop infinito com uma instruçãoif
que Ă© interrompido quando nĂŁo houver mais nenhum valor para desempacotar (unwrap) paraiter.next()
. Owhile let
fornece um atalho para o cenĂĄrio acima.
ExpressÔes match
(CorrespondĂȘncia)
A palavra-chave match
é usada para corresponder um valor a um ou mais padrÔes. Nesse sentido, funciona como uma série de expressÔes if let
:
fn main() { match std::env::args().next().as_deref() { Some("gato") => println!("Vai fazer coisas de gato"), Some("ls") => println!("Vou ls alguns arquivos"), Some("mv") => println!("Vamos mover alguns arquivos"), Some("rm") => println!("Uh, perigoso!"), None => println!("Hmm, nenhum nome de programa?"), _ => println!("Nome de programa desconhecido!"), } }
Assim como if let
, cada braço de correspondĂȘncia deve ter o mesmo tipo. O tipo Ă© a Ășltima expressĂŁo do bloco, se houver. No exemplo acima, o tipo Ă© ()
.
Consulte correspondĂȘncia de padrĂ”es (pattern matching) para obter mais detalhes sobre padrĂ”es em Rust.
- Salve o resultado de uma expressĂŁo de correspondĂȘncia
match
em uma variĂĄvel e imprima-a. - Remova
.as_deref()
e explique o erro gerado.std::env::Args().next()
retorna umOption<&String>
, porémmatch
nĂŁo funciona com o tipoString
.as_deref()
transforma umOption<T>
emOption<&T::Target>
. Em nosso caso, isso transforma umOption<String>
emOption<&str>
.- Agora podemos usar a correspondĂȘncia de padrĂ”es em um
&str
dentro deOption
.
CorrespondĂȘncia de PadrĂ”es
A palavra-chave match
permite que vocĂȘ corresponda um valor a um ou mais padrĂ”es (patterns). As comparaçÔes sĂŁo feitas de cima para baixo e a primeira correspondĂȘncia encontrada Ă© selecionada.
Os padrÔes podem ser valores simples, similarmente a switch
em C e C++:
fn main() { let input = 'x'; match input { 'q' => println!("Encerrando"), 'a' | 's' | 'w' | 'd' => println!("Movendo por ai"), '0'..='9' => println!("Entrada de nĂșmero"), _ => println!("Alguma outra coisa"), } }
O padrĂŁo _
Ă© um padrĂŁo curinga que corresponde a qualquer valor.
Pontos Chave:
- VocĂȘ pode apontar como alguns caracteres especĂficos podem ser usados em um padrĂŁo
|
como umou
..
pode expandir o quanto for necessĂĄrio1..=5
representa um intervalo inclusivo_
Ă© um curinga
- Pode ser Ăștil mostrar como funciona a vinculação, por exemplo, substituindo um caractere curinga por uma variĂĄvel ou removendo as aspas ao redor de
q
. - VocĂȘ pode demonstrar correspondĂȘncia em uma referĂȘncia.
- Este pode ser um bom momento para trazer à tona o conceito de padrÔes irrefutåveis, jå que o termo pode aparecer em mensagens de erro.
Desestruturando Enums
Os padrĂ”es tambĂ©m podem ser usados para vincular variĂĄveis a partes de seus valores. Ă assim que vocĂȘ inspeciona a estrutura de seus tipos. Vamos começar com um tipo enum
simples:
enum Result { Ok(i32), Err(String), } fn divide_in_two(n: i32) -> Result { if n % 2 == 0 { Result::Ok(n / 2) } else { Result::Err(format!("nĂŁo Ă© possĂvel dividir {n} em duas partes iguais")) } } fn main() { let n = 100; match divide_in_two(n) { Result::Ok(half) => println!("{n} divido em dois Ă© {half}"), Result::Err(msg) => println!("desculpe, aconteceu um erro: {msg}"), } }
Aqui usamos a verificação de correspondĂȘncia para desestruturar o valor contido em Result
. Na primeira verificação de correspondĂȘncia, half
estĂĄ vinculado ao valor dentro da variante Ok
. Na segunda, msg
estĂĄ vinculado Ă mensagem de erro.
Pontos chave:
- A expressĂŁo
if
/else
estĂĄ retornando umenum
que Ă© posteriormente descompactado com ummatch
. - VocĂȘ pode tentar adicionar uma terceira variante Ă definição de Enum e exibir os erros ao executar o cĂłdigo. Aponte os lugares onde seu cĂłdigo agora Ă© ânĂŁo exaustivoâ e como o compilador tenta lhe dar dicas.
Desestruturando Structs
VocĂȘ tambĂ©m pode desestruturar structs
:
struct Foo { x: (u32, u32), y: u32, } #[rustfmt::skip] fn main() { let foo = Foo { x: (1, 2), y: 3 }; match foo { Foo { x: (1, b), y } => println!("x.0 = 1, b = {b}, y = {y}"), Foo { y: 2, x: i } => println!("y = 2, x = {i:?}"), Foo { y, .. } => println!("y = {y}, outros campos foram ignorados"), } }
- Modifique os valores em
foo
para corresponder com os outros padrÔes. - Adicione um novo campo a
Foo
e faça mudanças nos padrĂ”es conforme necessĂĄrio. - A diferença entre uma captura (capture) e uma expressĂŁo constante pode ser difĂcil de perceber. Tente modificar o
2
no segundo braço para uma variĂĄvel, e veja que, de forma sĂștil, nĂŁo funciona. Mude paraconst
e veja funcionando novamente.
Desestruturando Matrizes
VocĂȘ pode desestruturar vetores, tuplas e slices combinando seus elementos:
#[rustfmt::skip] fn main() { let triple = [0, -2, 3]; println!("Fale-me sobre {triple:?}"); match triple { [0, y, z] => println!("Primeiro Ă© 0, y = {y} e z = {z}"), [1, ..] => println!("Primeiro Ă© 1 e o resto foi ignorado"), _ => println!("Todos os elementos foram ignorados"), } }
-
Desestruturar slices de tamanho desconhecido Ă© possĂvel utilizando padrĂ”es de tamanho fixo.
fn main() { inspect(&[0, -2, 3]); inspect(&[0, -2, 3, 4]); } #[rustfmt::skip] fn inspect(slice: &[i32]) { println!("Fale-me sobre {slice:?}"); match slice { &[0, y, z] => println!("Primeiro Ă© 0, y = {y} e z = {z}"), &[1, ..] => println!("Primeiro Ă© 1 e o resto foi ignorado"), _ => println!("Todos os elementos foram ignorados"), } }
-
Crie um novo padrĂŁo usando
_
para representar um elemento. -
Adicione mais valores ao vetor.
-
Aponte que
..
vai expandir para levar em conta um nĂșmero diferente de elementos. -
Mostre correspondĂȘncia com a cauda usando os padrĂ”es
[.., b]
and[a@..,b]
Guardas de CorrespondĂȘncia (Match Guards)
Ao verificar uma correspondĂȘncia, vocĂȘ pode adicionar uma guarda (guard) para um padrĂŁo. Ă uma expressĂŁo Booleana arbitrĂĄria que serĂĄ executada se o padrĂŁo corresponder:
#[rustfmt::skip] fn main() { let pair = (2, -2); println!("Fale-me sobre {pair:?}"); match pair { (x, y) if x == y => println!("Estes sĂŁo gĂȘmeos"), (x, y) if x + y == 0 => println!("Antimatter, kaboom!"), (x, _) if x % 2 == 1 => println!("O primeiro Ă© Ămpar"), _ => println!("Sem correlação..."), } }
Pontos Chave:
- Guardas de correspondĂȘncia, como um recurso de sintaxe separado, sĂŁo importantes e necessĂĄrias quando se quer expressar ideias mais complexas do que somente o padrĂŁo permitiria.
- Eles nĂŁo sĂŁo iguais Ă expressĂŁo
if
separada dentro do bloco de correspondĂȘncia. Uma expressĂŁoif
dentro do bloco de ramificação (depois de=>
) acontece depois que a correspondĂȘncia Ă© selecionada. A falha na condiçãoif
dentro desse bloco nĂŁo resultarĂĄ em outras verificaçÔes de correspondĂȘncia da expressĂŁomatch
original serem consideradas. - VocĂȘ pode usar as variĂĄveis definidas no padrĂŁo em sua expressĂŁo
if
. - A condição definida na guarda se aplica a todas as expressÔes em um padrão com um
|
.
Dia 1: ExercĂcios da Tarde
NĂłs iremos ver duas coisas:
-
The Luhn algorithm,
-
An exercise on pattern matching.
Depois de ver os exercĂcios, vocĂȘ pode ver as soluçÔes fornecidas.
Algoritmo de Luhn
O algoritmo de Luhn Ă© usado para validar nĂșmeros de cartĂŁo de crĂ©dito. O algoritmo recebe uma string como entrada e faz o seguinte para validar o nĂșmero do cartĂŁo de crĂ©dito:
-
Ignore todos os espaços. Rejeite nĂșmero com menos de dois dĂgitos.
-
Moving from right to left, double every second digit: for the number
1234
, we double3
and1
. For the number98765
, we double6
and8
. -
Depois de dobrar um dĂgito, some os dĂgitos. Portanto, dobrando
7
torna-se14
, que torna-se5
. -
Some todos os dĂgitos, dobrados ou nĂŁo.
-
O nĂșmero do cartĂŁo de crĂ©dito Ă© vĂĄlido se a soma terminar em
0
.
Copy the code below to https://play.rust-lang.org/ and implement the function.
Try to solve the problem the âsimpleâ way first, using for
loops and integers. Then, revisit the solution and try to implement it with iterators.
// TODO: remova isto quando vocĂȘ terminar sua implementação . #![allow(unused_variables, dead_code)] pub fn luhn(cc_number: &str) -> bool { unimplemented!() } #[test] fn test_non_digit_cc_number() { assert!(!luhn("foo")); } #[test] fn test_empty_cc_number() { assert!(!luhn("")); assert!(!luhn(" ")); assert!(!luhn(" ")); assert!(!luhn(" ")); } #[test] fn test_single_digit_cc_number() { assert!(!luhn("0")); } #[test] fn test_two_digit_cc_number() { assert!(luhn(" 0 0 ")); } #[test] fn test_valid_cc_number() { assert!(luhn("4263 9826 4026 9299")); assert!(luhn("4539 3195 0343 6467")); assert!(luhn("7992 7398 713")); } #[test] fn test_invalid_cc_number() { assert!(!luhn("4223 9826 4026 9299")); assert!(!luhn("4539 3195 0343 6476")); assert!(!luhn("8273 1232 7352 0569")); } #[allow(dead_code)] fn main() {}
Bem-vindos ao Dia 2
Agora que vimos uma boa quantidade de Rust, continuaremos com:
-
Gerenciamento de memĂłria: pilha versus heap, gerenciamento de memĂłria manual, gerenciamento de memĂłria baseado em escopo e garbage collection (coleta de lixo).
-
Ownership (posse): semùntica de move, cópia e clonagem, borrow (empréstimo) e lifetime (tempo de vida).
-
Structs and methods.
-
A Biblioteca PadrĂŁo:
String
,Option
eResult
,Vec
,HashMap
,Rc
eArc
. -
MĂłdulos: visibilidade, caminhos (paths), e hierarquia do sistema de arquivos.
Gerenciamento de MemĂłria
Tradicionalmente, as linguagens se dividem em duas grandes categorias:
- Controle total atravĂ©s do gerenciamento manual de memĂłria: C, C++, Pascal, âŠ
- Segurança total atravĂ©s do gerenciamento automĂĄtico de memĂłria em tempo de execução: Java, Python, Go, Haskell, âŠ
Rust oferece uma nova combinação:
Controle total e segurança por imposição do correto gerenciamento de memória em tempo de compilação.
Ele faz isso com um conceito de ownership (posse) explĂcito.
Primeiro, vamos rever como funciona o gerenciamento de memĂłria.
A Pilha (Stack) vs O Heap
-
Pilha: Ărea contĂnua de memĂłria para variĂĄveis locais.
- Os valores tĂȘm tamanhos fixos conhecidos em tempo de compilação.
- Extremamente rĂĄpida: basta mover um ponteiro de pilha.
- Fåcil de gerenciar: segue chamadas de função.
- Ătima localidade de memĂłria.
-
Heap: Armazenamento de valores fora das chamadas de função.
- Valores possuem tamanhos dinùmicos determinados em tempo de execução.
- Ligeiramente mais devagar que a pilha: Ă© necessĂĄrio um pouco de gerenciamento.
- Sem garantias de localidade de memĂłria.
Exemplo de Pilha e Heap
A criação de uma String
coloca metadados de tamanho fixo na pilha e dados dinamicamente dimensionados - a string propriamente dita - no heap:
fn main() { let s1 = String::from("OlĂĄ"); }
-
Mencione que uma
String
Ă© suportada por umVec
, portanto ela tem um tamanho e capacidade e pode crescer se for mutåvel por meio de realocação no heap. -
Se os alunos perguntarem sobre isso, vocĂȘ pode mencionar que a memĂłria subjacente Ă© alocada no heap usando o System Allocator e os alocadores personalizados podem ser implementados usando a API Allocator.
-
Podemos inspecionar o layout da memĂłria com cĂłdigo inseguro (
unsafe
). No entanto, vocĂȘ deve apontar que isso Ă© legitimamente inseguro!fn main() { let mut s1 = String::from("OlĂĄ"); s1.push(' '); s1.push_str("mundo"); // DON'T DO THIS AT HOME! For educational purposes only. // String provides no guarantees about its layout, so this could lead to // undefined behavior. unsafe { let (ptr, capacity, len): (usize, usize, usize) = std::mem::transmute(s1); println!("Ponteiro = {ptr:#x}, tamanho = {len}, capacidade = {capacity}"); } }
Gerenciamento Manual de MemĂłria
VocĂȘ mesmo aloca e desaloca memĂłria no heap.
Se isto não for feito com cuidado, travamentos, bugs, vulnerabilidades de segurança e vazamentos de memória podem ocorrer.
Exemplo em C
VocĂȘ deve chamar free
em cada ponteiro que alocar com malloc
:
void foo(size_t n) {
int* int_array = malloc(n * sizeof(int));
//
// ... vĂĄrias linhas de cĂłdigo
//
free(int_array);
}
Memória é vazada se a função retornar mais cedo entre malloc
e free
: o ponteiro é perdido e não podemos liberar a memória. Pior ainda, liberando o ponteiro duas vezes, ou acessando um ponteiro jå liberado pode levar a vulnerabilidades de segurança.
Gerenciamento de MemĂłria Baseado em Escopo
Construtores e destrutores permitem que o tempo de vida de um objeto seja rastreado.
Ao envolver um ponteiro em um objeto, vocĂȘ pode liberar memĂłria quando o objeto Ă© destruĂdo. O compilador garante que isso aconteça, mesmo que uma exceção seja lançada.
Isso geralmente é chamado de aquisição de recursos é inicialização (Resource Acquisition Is Initialization, RAII) e fornece ponteiros inteligentes (smart pointers).
Exemplo em C++
void say_hello(std::unique_ptr<Person> person) {
std::cout << "OlĂĄ " << person->name << std::endl;
}
- O objeto
std::unique_ptr
Ă© alocado na pilha e aponta para memĂłria alocada no heap. - No final de
diga_ola
, o destrutorstd::unique_ptr
serĂĄ executado. - O destrutor libera o objeto
Pessoa
para o qual ele aponta.
Construtores especiais de movimento (move) sĂŁo usados ao passar o âownershipâ para uma função:
std::unique_ptr<Person> person = find_person("Carla");
say_hello(std::move(person));
Gerenciamento AutomĂĄtico de MemĂłria
Uma alternativa ao gerenciamento de memĂłria manual e baseado em escopo Ă© o gerenciamento automĂĄtico de memĂłria:
- O programador nunca aloca ou desaloca memĂłria explicitamente.
- Um âcoletor de lixoâ (garbage collector) encontra memĂłria nĂŁo utilizada e a desaloca para o programador.
Exemplo em Java
O objeto pessoa
nĂŁo Ă© desalocado depois que digaOla
retorna:
void sayHello(Person person) {
System.out.println("OlĂĄ " + person.getName());
}
Gerenciamento de MemĂłria no Rust
O gerenciamento de memória no Rust é uma combinação:
- Seguro e correto como Java, mas sem um coletor de lixo.
- Dependendo de qual abstração (ou combinação de abstraçÔes) vocĂȘ escolher, pode ser um simples ponteiro Ășnico, referĂȘncia contada ou referĂȘncia atomicamente contada.
- Baseado em escopo como C++, mas o compilador impÔe adesão total.
- Um usuårio do Rust pode escolher a abstração certa para a situação, algumas até sem custo em tempo de execução como C.
O Rust consegue isso modelando o ownership (posse) explicitamente.
-
Neste ponto, se perguntado como, vocĂȘ pode mencionar que em Rust isso geralmente Ă© tratado por wrappers (invĂłlucros) RAII tais como Box, Vec, Rc ou Arc. Eles encapsulam a propriedade (ownership) e a alocação de memĂłria por vĂĄrios meios e previnem os erros possĂveis em C.
-
Aqui vocĂȘ pode ser perguntado sobre destrutores, o trait Drop Ă© o equivalente em Rust.
Comparação
Aqui estå uma comparação aproximada das técnicas de gerenciamento de memória.
Vantagens de Diferentes TĂ©cnicas de Gerenciamento de MemĂłria
- Manual como C:
- Nenhuma sobrecarga em tempo de execução.
- AutomĂĄtico como Java:
- Totalmente automatizado.
- Seguro e correto.
- Baseado em escopo como C++:
- Parcialmente automĂĄtico.
- Nenhuma sobrecarga em tempo de execução.
- Baseado em escopo imposto pelo compilador como Rust:
- Imposto pelo compilador.
- Nenhuma sobrecarga em tempo de execução.
- Seguro e correto.
Desvantagens de Diferentes TĂ©cnicas de Gerenciamento de MemĂłria
- Manual como C:
- Uso após a liberação (use-after-free).
- LiberaçÔes duplas (double-frees).
- Vazamentos de memĂłria.
- AutomĂĄtico como Java:
- Pausas para coleta de lixo.
- Atrasos na execução de destrutores.
- Baseado em escopo como C++:
- Complexo, o programador deve optar em utilizĂĄ-las.
- ReferĂȘncias circulares podem causar vazamentos de memĂłria
- Potencial impacto negativo em desempenho em tempo de execução
- Imposto pelo compilador e baseado em escopo como Rust:
- Alguma complexidade inicial.
- Pode rejeitar programas vĂĄlidos.
Ownership
Todas as associaçÔes de variĂĄveis tĂȘm um escopo onde sĂŁo vĂĄlidas e Ă© um erro usar uma variĂĄvel fora de seu escopo:
struct Point(i32, i32); fn main() { { let p = Point(3, 4); println!("x: {}", p.0); } println!("y: {}", p.1); }
- No final do escopo, a variĂĄvel Ă© eliminada (âdropadaâ) e os dados sĂŁo liberados.
- Um destrutor pode ser executado aqui para liberar recursos.
- Dizemos que a variĂĄvel possui (owns) o valor.
SemĂąntica do Move (mover)
Uma atribuição transferirå o ownership entre variåveis:
fn main() { let s1: String = String::from("OlĂĄ!"); let s2: String = s1; println!("s2: {s2}"); // println!("s1: {s1}"); }
- A atribuição de
s1
as2
transfere o ownership. - Quando
s1
sai do escopo, nada acontece: ele nĂŁo tem ownership. - Quando
s2
sai do escopo, os dados da string sĂŁo liberados. - HĂĄ sempre exatamente uma associação de variĂĄvel que possui (âownsâ) um valor.
-
Mencione que isso Ă© o oposto dos defaults (padrĂ”es) em C++, que copia por valor, a menos que vocĂȘ use
std::move
(e seu construtor esteja definido!). -
Apenas o ownership é movido. A geração de código de måquina para manipular os dados é uma questão de otimização, e essas cópias são agressivamente otimizadas.
-
Valores simples (tais como inteiros) podem ser marcados como
Copy
(cĂłpia) (veja slides mais adiante). -
No Rust, clones sĂŁo explĂcitos (utilizando-se
clone
).
Strings Movidas em Rust
fn main() { let s1: String = String::from("Rust"); let s2: String = s1; }
- Os dados no heap de
s1
sĂŁo reutilizados paras2
. - Quando
s1
sai do escopo, nada acontece (foi movido dele).
Antes de mover para s2
:
Depois de mover para s2
:
Trabalho Extra em C++ Moderno
O C++ moderno resolve isso de maneira diferente:
std::string s1 = "Cpp";
std::string s2 = s1; // Duplica os dados em s1.
- Os dados de
s1
no heap sĂŁo duplicados es2
obtém sua própria cópia independente. - Quando
s1
es2
saem de escopo, cada um libera sua prĂłpria memĂłria.
Antes da atribuição por cópia:
Após atribuição por cópia:
Move em Chamadas de Função
Quando vocĂȘ passa um valor para uma função, o valor Ă© atribuĂdo ao parĂąmetro da função. Isso transfere a ownership:
fn say_hello(name: String) { println!("OlĂĄ {name}") } fn main() { let name = String::from("Alice"); say_hello(name); // say_hello(name); }
- Com a primeira chamada para
diga_ola
,main
desiste da ownership denome
. Depois disso,nome
nĂŁo pode mais ser usado dentro demain
. - A memĂłria do heap alocada para
name
serå liberada no final da funçãosay_hello
. main
pode manter a ownership se passarnome
como uma referĂȘncia (&name
) e sesay_hello
aceitar uma referĂȘncia como um parĂąmetro.- Alternativamente,
main
pode passar um clone denome
na primeira chamada (name.clone()
). - Rust torna mais difĂcil a criação de cĂłpias inadvertidamente do que o C++, tornando padrĂŁo a semĂąntica de movimento e forçando os programadores a tornar os clones explĂcitos.
Copia e Clonagem
Embora a semĂąntica de movimento seja o padrĂŁo, certos tipos sĂŁo copiados por padrĂŁo:
fn main() { let x = 42; let y = x; println!("x: {x}"); println!("y: {y}"); }
Esses tipos implementam o trait Copy
.
VocĂȘ pode habilitar seus prĂłprios tipos para usar a semĂąntica de cĂłpia:
#[derive(Copy, Clone, Debug)] struct Point(i32, i32); fn main() { let p1 = Point(3, 4); let p2 = p1; println!("p1: {p1:?}"); println!("p2: {p2:?}"); }
- Após a atribuição, tanto
p1
quantop2
possuem seus próprios dados. - Também podemos usar
p1.clone()
para copiar os dados explicitamente.
Copia e clonagem nĂŁo sĂŁo a mesma coisa:
- Cópia refere-se a cópias bit a bit de regiÔes de memória e não funciona em objetos arbitrårios.
- CĂłpia nĂŁo permite lĂłgica personalizada (ao contrĂĄrio dos construtores de cĂłpia em C++).
- Clonagem é uma operação mais geral e também permite um comportamento personalizado através da implementação do trait
Clone
. - CĂłpia nĂŁo funciona em tipos que implementam o trait
Drop
.
No exemplo acima, tente o seguinte:
- Adicione um campo
String
aostruct Point
. Ele nĂŁo irĂĄ compilar porqueString
nĂŁo Ă© um tipoCopy
. - Remova
Copy
do atributoderive
. O erro do compilador agora estĂĄ noprintln!
parap1
. - Mostre que ele funciona se ao invĂ©s disso vocĂȘ clonar
p1
.
Se os alunos perguntarem sobre derive
, basta dizer que isto é uma forma de gerar código em Rust em tempo de compilação. Nesse caso, as implementaçÔes padrão dos traits Copy
e Clone
sĂŁo geradas.
Empréstimo (Borrowing)
Em vez de transferir a ownership ao chamar uma função, vocĂȘ pode permitir que uma função empreste o valor:
#[derive(Debug)] struct Point(i32, i32); fn add(p1: &Point, p2: &Point) -> Point { Point(p1.0 + p2.0, p1.1 + p2.1) } fn main() { let p1 = Point(3, 4); let p2 = Point(10, 20); let p3 = add(&p1, &p2); println!("{p1:?} + {p2:?} = {p3:?}"); }
- A função
add
pega emprestado (borrows) dois pontos e retorna um novo ponto. - O chamador mantém a ownership das entradas.
Notas sobre os retornos da pilha:
-
Demonstre que o retorno de
somar
Ă© barato porque o compilador pode eliminar a operação de cĂłpia. Modifique o cĂłdigo acima para imprimir endereços da pilha e execute-o no Playground ou veja o cĂłdigo assembly em Godbolt. No nĂvel de otimização âDEBUGâ, os endereços devem mudar, enquanto eles permanecem os mesmos quando a configuração Ă© alterada para âRELEASEâ:#[derive(Debug)] struct Point(i32, i32); fn add(p1: &Point, p2: &Point) -> Point { let p = Point(p1.0 + p2.0, p1.1 + p2.1); println!("&p.0: {:p}", &p.0); p } pub fn main() { let p1 = Point(3, 4); let p2 = Point(10, 20); let p3 = add(&p1, &p2); println!("&p3.0: {:p}", &p3.0); println!("{p1:?} + {p2:?} = {p3:?}"); }
-
O compilador Rust pode fazer otimização de valor de retorno (Return Value Operation - RVO).
-
Em C++, a elisão (omissão) de cópia deve ser definida na especificação da linguagem porque os construtores podem ter efeitos colaterais. Em Rust, isso não é um problema. Se o RVO não aconteceu, o Rust sempre executarå uma cópia
memcpy
simples e eficiente.
EmprĂ©stimos Compartilhados e Ănicos
O Rust coloca restriçÔes nas formas como vocĂȘ pode emprestar valores:
- VocĂȘ pode ter um ou mais valores
&T
a qualquer momento, ou - VocĂȘ pode ter exatamente um valor
&mut T
.
fn main() { let mut a: i32 = 10; let b: &i32 = &a; { let c: &mut i32 = &mut a; *c = 20; } println!("a: {a}"); println!("b: {b}"); }
- O cĂłdigo acima nĂŁo compila porque
a
é emprestado como mutåvel (através dec
) e como imutåvel (através deb
) ao mesmo tempo. - Mova a instrução
println!
parab
antes do escopo que introduzc
para fazer o código compilar. - Após essa alteração, o compilador percebe que
b
só é usado antes do novo empréstimo mutåvel dea
através dec
. Este Ă© um recurso do verificador de emprĂ©stimo (borrow checker) chamado âtempos de vida nĂŁo lexicaisâ.
Tempos de Vida (Lifetimes)
Um valor emprestado tem um tempo de vida (lifetime):
- O tempo de vida pode ser implĂcito:
add(p1: &Point, p2: &Point) -> Point
. - Tempos de vida tambĂ©m podem ser explĂcitos:
&'a Point
,&'documento str
. - Leia
&'a Point
como âumPoint
emprestado que Ă© vĂĄlido por pelo menos o tempo de vidaa
â. - Tempos de vida sĂŁo sempre inferidos pelo compilador: vocĂȘ nĂŁo pode atribuir um tempo de vida vocĂȘ mesmo.
- AnotaçÔes de tempo de vida criam restriçÔes; o compilador verifica se hå uma solução vålida.
- Tempos de vida para argumentos de função e valores de retorno precisam ser completamente especificados, mas o Rust permite que eles sejam omitidos na maioria das vezes com algumas regras simples.
Tempos de vida (Lifetimes) em Chamadas de Função
Além de emprestar seus argumentos, uma função pode retornar um valor emprestado:
#[derive(Debug)] struct Point(i32, i32); fn left_most<'a>(p1: &'a Point, p2: &'a Point) -> &'a Point { if p1.0 < p2.0 { p1 } else { p2 } } fn main() { let p1: Point = Point(10, 10); let p2: Point = Point(20, 20); let p3: &Point = left_most(&p1, &p2); println!("Ponto mais Ă esquerda: {:?}", p3); }
'a
é um parùmetro genérico, ele é inferido pelo compilador.- Os tempos de vida começam com
'
e'a
Ă© um name padrĂŁo tĂpico. - Leia
&'a Point
como âumPoint
emprestado que Ă© vĂĄlido por pelo menos o tempo de vidaa
â.- A parte pelo menos Ă© importante quando os parĂąmetros estĂŁo em escopos diferentes.
No exemplo acima, tente o seguinte:
-
Mova a declaração de
p2
ep3
para um novo escopo ({ ... }
), resultando no seguinte cĂłdigo:#[derive(Debug)] struct Point(i32, i32); fn left_most<'a>(p1: &'a Point, p2: &'a Point) -> &'a Point { if p1.0 < p2.0 { p1 } else { p2 } } fn main() { let p1: Point = Point(10, 10); let p3: &Point; { let p2: Point = Point(20, 20); p3 = left_most(&p1, &p2); } println!("Ponto mais Ă esquerda: {:?}", p3); }
Note como isto nĂŁo compila uma vez que
p3
vive mais quep2
. -
Reinicie o espaço de trabalho e altere a assinatura da função para
fn left_most<'a, 'b>(p1: &'a Point, p2: &'a Point) -> &'b Point
. Isso não serå compilado porque a relação entre os tempos de vida'a
e'b
nĂŁo Ă© clara. -
Outra forma de explicar:
- Duas referĂȘncias a dois valores sĂŁo emprestadas por uma função e a função retorna outra referĂȘncia.
- Ela deve ter vindo de uma dessas duas entradas (ou de uma variĂĄvel global).
- De qual? O compilador precisa saber, de forma que no local da chamada a referĂȘncia retornada nĂŁo seja usada por mais tempo do que uma variĂĄvel de onde veio a referĂȘncia.
Tempos de Vida em Estruturas de Dados
Se um tipo de dados armazena dados emprestados, ele deve ser anotado com um tempo de vida:
#[derive(Debug)] struct Highlight<'doc>(&'doc str); fn erase(text: String) { println!("Até logo {text}!"); } fn main() { let text = String::from("A raposa marrom ågil pula sobre o cachorro preguiçoso."); let fox = Highlight(&text[4..19]); let dog = Highlight(&text[35..43]); // erase(text); println!("{fox:?}"); println!("{dog:?}"); }
- No exemplo acima, a anotação em
Highlight
impÔe que os dados subjacentes ao&str
contido vivam pelo menos tanto quanto qualquer instĂąncia deHighlight
que use esses dados. - Se
text
for consumido antes do final do tempo de vida defox
(oudog
), o verificador de emprĂ©stimo lançarĂĄ um erro. - Tipos com dados emprestados forçam os usuĂĄrios a manter os dados originais. Isso pode ser Ăștil para criar exibiçÔes leves, mas geralmente as tornam um pouco mais difĂceis de usar.
- Quando possĂvel, faça com que as estruturas de dados possuam (own) seus dados diretamente.
- Algumas structs com mĂșltiplas referĂȘncias internas podem ter mais de uma anotação de tempo de vida. Isso pode ser necessĂĄrio se houver a necessidade de descrever-se relacionamentos de tempo de vida entre as prĂłprias referĂȘncias, alĂ©m do tempo de vida da prĂłpria struct. Esses sĂŁo casos de uso bastante avançados.
Dia 2: ExercĂcios Matinais
Veremos a implementação de métodos em dois contextos:
-
Uma struct simples que guarda estatĂsticas de saĂșde.
-
VĂĄrias structs e enums para uma biblioteca de desenho.
Depois de ver os exercĂcios, vocĂȘ pode ver as soluçÔes fornecidas.
Armazenando Livros
NĂłs iremos aprender muito mais sobre structs e o tipo Vec<T>
amanhĂŁ. Por hora, vocĂȘ sĂł precisa conhecer parte de sua API:
fn main() { let mut vec = vec![10, 20]; vec.push(30); let midpoint = vec.len() / 2; println!("valor do meio: {}", vec[midpoint]); for item in &vec { println!("item: {item}"); } }
Use isto para modelar uma coleção de livros de uma biblioteca. Copie o código abaixo para https://play.rust-lang.org/ e atualize os tipos para compilar:
struct Library { books: Vec<Book>, } struct Book { title: String, year: u16, } impl Book { // Este Ă© um construtor, utilizado abaixo. fn new(title: &str, year: u16) -> Book { Book { title: String::from(title), year, } } } // Implemente os mĂ©todos abaixo. Atualize o parĂąmetro `self` para // indicar o nĂvel requerido de ownership sobre o objeto: // // - `&self` para acesso compartilhado de apenas leitura, // - `&mut self` para acesso mutĂĄvel exclusivo, // - `self` para acesso exclusivo por valor. impl Library { fn new() -> Library { todo!("Inicialize e retorne um valor `Biblioteca`") } //fn tamanho(self) -> usize { // todo!("Retorne o tamanho de `self.livros`") //} //fn esta_vazia(self) -> bool { // todo!("Retorne `true` se `self.livros` for vazio") //} //fn adicionar_livro(self, book: Livro) { // todo!("Adicione um novo livro em `self.livros`") //} //fn imprimir_livros(self) { // todo!("Itere sobre `self.livros` e sobre o tĂtulo e ano de cada livro") //} //fn livro_mais_antigo(self) -> Option<&Livro> { // todo!("Retorne uma referĂȘncia para o livro mais antigo (se houver)") //} } // Isto demonstra o comportamento esperado. Descomente o cĂłdigo abaixo e // implemente os mĂ©todos que faltam. VocĂȘ precisarĂĄ atualizar as // assinaturas dos mĂ©todos, incluindo o parĂąmetro "self"! VocĂȘ talvez // precise atualizar as atribuiçÔes de variĂĄvel dentro de `main()`. fn main() { let library = Library::new(); //println!("A biblioteca estĂĄ vazia: biblioteca.esta_vazia() -> {}", biblioteca.esta_vazia()); // //biblioteca.adicionar_livro(Livro::new("Lord of the Rings", 1954)); //biblioteca.adicionar_livro(Livro::new("Alice's Adventures in Wonderland", 1865)); // //println!("The biblioteca nĂŁo estĂĄ mais vazia: biblioteca.esta_vazia() -> {}", biblioteca.esta_vazia()); // // //biblioteca.imprimir_livros(); // //match biblioteca.livro_mais_antigo() { // Some(livro) => println!("O livro mais antigo Ă© {}", livro.titulo), // None => println!("A biblioteca estĂĄ vazia!"), //} // //println!("The biblioteca tem {} livros", biblioteca.tamanho()); //biblioteca.imprimir_livros(); }
Iteradores e Ownership (Posse)
O modelo de ownership do Rust afeta muitas APIs. Um exemplo disso sĂŁo os traits Iterator
e IntoIterator
.
Iterator
(Iterador)
Os traits são como interfaces: eles descrevem o comportamento (métodos) para um tipo. O trait Iterator
simplesmente diz que vocĂȘ pode chamar next
até obter None
como retorno:
#![allow(unused)] fn main() { pub trait Iterator { type Item; fn next(&mut self) -> Option<Self::Item>; } }
VocĂȘ usa esse trait da seguinte forma:
fn main() { let v: Vec<i8> = vec![10, 20, 30]; let mut iter = v.iter(); println!("v[0]: {:?}", iter.next()); println!("v[1]: {:?}", iter.next()); println!("v[2]: {:?}", iter.next()); println!("Sem mais itens: {:?}", iter.next()); }
Qual Ă© o tipo retornado pelo iterador? Teste sua resposta aqui:
fn main() { let v: Vec<i8> = vec![10, 20, 30]; let mut iter = v.iter(); let v0: Option<..> = iter.next(); println!("v0: {v0:?}"); }
Por que esse tipo?
IntoIterator
O trait Iterator
informa como iterar depois de criar um iterador. O trait relacionado IntoIterator
lhe informa como criar o iterador:
#![allow(unused)] fn main() { pub trait IntoIterator { type Item; type IntoIter: Iterator<Item = Self::Item>; fn into_iter(self) -> Self::IntoIter; } }
A sintaxe aqui significa que toda implementação de IntoIterator
deve declarar dois tipos:
Item
: o tipo sobre o qual iteramos, comoi8
,IntoIter
: o tipoIterator
retornado pelo métodointo_iter
.
Observe que IntoIter
e Item
estĂŁo vinculados: o iterador deve ter o mesmo tipo Item
, o que significa que ele retorna Option<Item>
Como antes, qual Ă© o tipo retornado pelo iterador?
fn main() { let v: Vec<String> = vec![String::from("foo"), String::from("bar")]; let mut iter = v.into_iter(); let v0: Option<..> = iter.next(); println!("v0: {v0:?}"); }
Loops for
Agora que conhecemos Iterator
e IntoIterator
, podemos construir loops for
. Eles chamam into_iter()
em uma expressĂŁo e itera sobre o iterador resultante:
fn main() { let v: Vec<String> = vec![String::from("foo"), String::from("bar")]; for word in &v { println!("palavra: {word}"); } for word in v { println!("palavra: {word}"); } }
Qual Ă© o tipo de palavra
em cada laço?
Experimente com o código acima e depois consulte a documentação para impl IntoIterator para &Vec<T>
e impl IntoIterator para Vec<T>
para verificar suas respostas.
Structs
Como C e C++, Rust tem suporte para structs
personalizadas:
struct Person { name: String, age: u8, } fn main() { let mut peter = Person { name: String::from("Pedro"), age: 27, }; println!("{} tem {} anos.", peter.name, peter.age); peter.age = 28; println!("{} tem {} anos.", peter.name, peter.age); let jackie = Person { name: String::from("Jackie"), ..peter }; println!("{} tem {} anos.", jackie.name, jackie.age); }
Pontos Chave:
- Structs funcionam como em C ou C++.
- Como em C++, e ao contrĂĄrio de C, nenhum
typedef
é necessårio para definir um tipo. - Ao contrårio do C++, não hå herança entre structs.
- Como em C++, e ao contrĂĄrio de C, nenhum
- Os métodos são definidos em um bloco
impl
, que veremos nos prĂłximos slides. - Este pode ser um bom momento para que as pessoas saibam que existem diferentes tipos de structs.
- Structs de tamanho zero
por exemplo, struct Foo;
podem ser usadas ao implementar uma caracterĂstica em algum tipo, mas nĂŁo possuem nenhum dado que vocĂȘ deseja armazenar nelas. - O prĂłximo slide apresentarĂĄ as estruturas tuplas (Estruturas Tupla) usadas quando o nome dos campos nĂŁo sĂŁo importantes.
- Structs de tamanho zero
- A sintaxe
..pedro
permite copiar a maioria dos campos de uma struct sem precisar explicitar seus tipos. Sempre deve ser o Ășltimo elemento.
Estruturas de Tuplas (Tuple Structs)
Se os nomes dos campos nĂŁo forem importantes, vocĂȘ pode usar uma estrutura de tupla:
struct Point(i32, i32); fn main() { let p = Point(17, 23); println!("({}, {})", p.0, p.1); }
Isso Ă© comumente utilizado para wrappers (invĂłlucros) com campo Ășnico (chamados newtypes):
struct PoundsOfForce(f64); struct Newtons(f64); fn compute_thruster_force() -> PoundsOfForce { todo!("Pergunte para um cientista de foguetes da NASA") } fn set_thruster_force(force: Newtons) { // ⊠} fn main() { let force = compute_thruster_force(); set_thruster_force(force); }
- Newtypes são uma ótima maneira de codificar informaçÔes adicionais sobre o valor em um tipo primitivo, por exemplo:
- O nĂșmero Ă© medido em algumas unidades:
Newtons
no exemplo acima. - O valor passou por alguma validação quando foi criado, então não é preciso validå-lo novamente a cada uso:
NumeroTelefone(String)
ouNumeroImpar(u32)
.
- O nĂșmero Ă© medido em algumas unidades:
- Demonstre como somar um valor
f64
em um valor do tipoNewtons
acessando o campo Ășnico no newtype.- Geralmente, Rust nĂŁo gosta de coisas implĂcitas, como unwrapping automĂĄtico ou, por exemplo, usar booleanos como inteiros.
- Sobrecarga de operadores Ă© discutido no Dia 3 (generics).
- O examplo Ă© uma referĂȘncia sutil a falha do Orbitador ClimĂĄtico de Marte.
Sintaxe Abreviada de Campos
Se vocĂȘ jĂĄ tiver variĂĄveis com os nomes corretos, poderĂĄ criar a estrutura (struct) usando uma abreviação:
#[derive(Debug)] struct Person { name: String, age: u8, } impl Person { fn new(name: String, age: u8) -> Person { Person { name, age } } } fn main() { let peter = Person::new(String::from("Pedro"), 27); println!("{peter:?}"); }
-
A função
new
poderia ser escrita utilizandoSelf
como tipo, jĂĄ que ele Ă© intercambiĂĄvel com o nome da struct#[derive(Debug)] struct Person { name: String, age: u8, } impl Person { fn new(name: String, age: u8) -> Self { Self { name, age } } }
-
Implemente a trait
Default
(PadrĂŁo) para a struct. Defina alguns campos e utilize valores padrĂŁo para os demais.#[derive(Debug)] struct Person { name: String, age: u8, } impl Default for Person { fn default() -> Person { Person { name: "RobĂŽ".to_string(), age: 0, } } } fn create_default() { let tmp = Person { ..Person::default() }; let tmp = Person { name: "Sam".to_string(), ..Person::default() }; }
-
MĂ©todos sĂŁo definidos no bloco
impl
. -
Use a sintaxe de atualização de estruturas para definir uma nova
struct
usandopeter
. Note que a variĂĄvelpeter
nĂŁo serĂĄ mais acessĂvel apĂłs. -
Utilize
{:#?}
para imprimir structs utilizando a representação de depuração (Debug
).
MĂ©todos
Rust permite que vocĂȘ associe funçÔes aos seus novos tipos. VocĂȘ faz isso com um bloco impl
:
#[derive(Debug)] struct Person { name: String, age: u8, } impl Person { fn say_hello(&self) { println!("OlĂĄ, meu nome Ă© {}", self.name); } } fn main() { let peter = Person { name: String::from("Pedro"), age: 27, }; peter.say_hello(); }
Pontos Chave:
- Pode ser Ăștil introduzir mĂ©todos comparando-os com funçÔes.
- MĂ©todos sĂŁo chamados em uma instĂąncia de um tipo (como struct ou enum), o primeiro parĂąmetro representa a instĂąncia como
self
. - Os desenvolvedores podem optar por usar mĂ©todos para aproveitar a sintaxe do receptor do mĂ©todo e ajudar a mantĂȘ-los mais organizados. Usando mĂ©todos, podemos manter todo o cĂłdigo de implementação em um local previsĂvel.
- MĂ©todos sĂŁo chamados em uma instĂąncia de um tipo (como struct ou enum), o primeiro parĂąmetro representa a instĂąncia como
- Destaque o uso da palavra-chave
self
, um receptor de método.- Mostre que é um termo abreviado para
self:Self
e talvez mostre como o nome da struct também poderia ser usado. - Explique que
Self
Ă© um apelido de tipo para o tipo em que o blocoimpl
estĂĄ e pode ser usado em qualquer outro lugar no bloco. - Observe como
self
é usado como outras Structs e a notação de ponto pode ser usada para se referir a campos individuais. - Este pode ser um bom momento para demonstrar como
&self
difere deself
modificando o cĂłdigo e tentando executardizer_ola
duas vezes.
- Mostre que Ă© um termo abreviado para
- Descreveremos a distinção entre os receptores de método a seguir.
Receptor de MĂ©todo
O &self
acima indica que o mĂ©todo toma emprestado o objeto imutavelmente. Existem outros receptores possĂveis para um mĂ©todo:
&self
: pega emprestado o objeto do chamador como uma referĂȘncia compartilhada e imutĂĄvel. O objeto pode ser usado novamente depois.&mut self
: pega emprestado o objeto do chamador como uma referĂȘncia Ășnica e mutĂĄvel. O objeto pode ser usado novamente depois.self
: toma posse do objeto e o move do chamador. O método se torna o proprietårio do objeto. O objeto serå descartado (desalocado) quando o método retorna, a menos que sua ownership (posse) seja explicitamente transmitida. Posse completa não significa automaticamente mutabilidade.mut self
: o mesmo que acima, mas enquanto o método possui o objeto, ele pode alterå-lo também.- Sem receptor: isso se torna um método eståtico (static) na estrutura. Normalmente usado para criar construtores que, por convenção, são chamados
new
.
Além das variantes de self
, também existem tipos especiais de wrapper que podem ser tipos de receptores, como Box<Self>
.
Considere enfatizar âcompartilhado e imutĂĄvelâ e âĂșnico e mutĂĄvelâ. Essas restriçÔes sempre vĂȘm juntos no Rust devido Ă s regras do Borrow Checker (verificador de emprĂ©stimo), e self
nĂŁo Ă© uma exceção. NĂŁo serĂĄ possĂvel referenciar uma struct de vĂĄrios locais e chamar um mĂ©todo mutĂĄvel (&mut self
) nela.
Exemplo
#[derive(Debug)] struct Race { name: String, laps: Vec<i32>, } impl Race { fn new(name: &str) -> Race { // Sem receptor, mĂ©todo estĂĄtico Race { name: String::from(name), laps: Vec::new() } } fn add_lap(&mut self, lap: i32) { // EmprĂ©stimo Ășnico com acesso de leitura e escrita em self self.laps.push(lap); } fn print_laps(&self) { // EmprĂ©stimo compartilhado com acesso apenas de leitura em self println!("Registrou {} voltas para {}:", self.laps.len(), self.name); for (idx, lap) in self.laps.iter().enumerate() { println!("Volta {idx}: {lap} seg"); } } fn finish(self) { // Propriedade exclusiva de self let total = self.laps.iter().sum::<i32>(); println!("Corrida {} foi encerrada, tempo de voltas total: {}", self.name, total); } } fn main() { let mut race = Race::new("Monaco Grand Prix"); race.add_lap(70); race.add_lap(68); race.print_laps(); race.add_lap(71); race.print_laps(); race.finish(); // race.add_lap(42); }
Pontos Chave:
- Todos os quatro métodos aqui usam um receptor de método diferente.
- VocĂȘ pode apontar como isso muda o que a função pode fazer com os valores das variĂĄveis e se/como ela pode ser usada novamente na
main
. - VocĂȘ pode mostrar o erro que aparece ao tentar chamar
encerrar
duas vezes.
- VocĂȘ pode apontar como isso muda o que a função pode fazer com os valores das variĂĄveis e se/como ela pode ser usada novamente na
- Observe que, embora os receptores do método sejam diferentes, as funçÔes não eståticas são chamadas da mesma maneira no corpo principal. Rust permite referenciar e desreferenciar automaticamente ao chamar métodos. Rust adiciona automaticamente
&
,*
,muts
para que esse objeto corresponda Ă assinatura do mĂ©todo. - VocĂȘ pode apontar que
imprimir_voltas
estĂĄ usando um vetor e iterando sobre ele. Descreveremos os vetores com mais detalhes Ă tarde.
Dia 2: ExercĂcios da Tarde
Os exercĂcios desta tarde se concentrarĂŁo em strings e iteradores.
Depois de ver os exercĂcios, vocĂȘ pode ver as soluçÔes fornecidas.
EstatĂsticas de SaĂșde
VocĂȘ estĂĄ trabalhando na implementação de um sistema de monitoramento de saĂșde. Como parte disso, vocĂȘ precisa acompanhar as estatĂsticas de saĂșde dos usuĂĄrios.
VocĂȘ começarĂĄ com algumas funçÔes fragmentadas em um bloco impl
e também com a definição da estrutura Usuario
. Seu objetivo é implementar os métodos esboçados para a struct
Usuario
definidos no bloco impl
.
Copie o código abaixo em https://play.rust-lang.org/ e implemente os métodos que estão faltando:
// TODO: remova isto quando vocĂȘ terminar sua implementação . #![allow(unused_variables, dead_code)] pub struct User { name: String, age: u32, height: f32, visit_count: usize, last_blood_pressure: Option<(u32, u32)>, } pub struct Measurements { height: f32, blood_pressure: (u32, u32), } pub struct HealthReport<'a> { patient_name: &'a str, visit_count: u32, height_change: f32, blood_pressure_change: Option<(i32, i32)>, } impl User { pub fn new(name: String, age: u32, height: f32) -> Self { unimplemented!() } pub fn name(&self) -> &str { unimplemented!() } pub fn age(&self) -> u32 { unimplemented!() } pub fn height(&self) -> f32 { unimplemented!() } pub fn doctor_visits(&self) -> u32 { unimplemented!() } pub fn set_age(&mut self, new_age: u32) { unimplemented!() } pub fn set_height(&mut self, new_height: f32) { unimplemented!() } pub fn visit_doctor(&mut self, measurements: Measurements) -> HealthReport { unimplemented!() } } fn main() { let bob = User::new(String::from("Bob"), 32, 155.2); println!("I'm {} and my age is {}", bob.name(), bob.age()); } #[test] fn test_height() { let bob = User::new(String::from("Bob"), 32, 155.2); assert_eq!(bob.height(), 155.2); } #[test] fn test_set_age() { let mut bob = User::new(String::from("Bob"), 32, 155.2); assert_eq!(bob.age(), 32); bob.set_age(33); assert_eq!(bob.age(), 33); } #[test] fn test_visit() { let mut bob = User::new(String::from("Bob"), 32, 155.2); assert_eq!(bob.doctor_visits(), 0); let report = bob.visit_doctor(Measurements { height: 156.1, blood_pressure: (120, 80), }); assert_eq!(report.patient_name, "Bob"); assert_eq!(report.visit_count, 1); assert_eq!(report.blood_pressure_change, None); let report = bob.visit_doctor(Measurements { height: 156.1, blood_pressure: (115, 76), }); assert_eq!(report.visit_count, 2); assert_eq!(report.blood_pressure_change, Some((-5, -4))); }
Biblioteca PadrĂŁo
Rust vem com uma biblioteca padrĂŁo (standard library) que ajuda a estabelecer um conjunto de tipos comuns usados por bibliotecas e programas Rust. Dessa forma, duas bibliotecas podem trabalhar juntas sem problemas porque ambas usam o mesmo tipo String
.
Os tipos de vocabulĂĄrio comuns incluem:
-
Option
eResult
: tipos usados para valores opcionais e tratamento de erro. -
String
: o tipo de string padrĂŁo usado para dados owned. -
Vec
: um vetor extensĂvel padrĂŁo. -
HashMap
: um tipo de mapa de hash com um algoritmo de hash configurĂĄvel. -
Box
: um ponteiro owned para dados alocados em heap. -
Rc
: um ponteiro de contagem de referĂȘncia compartilhado para dados alocados em heap.
- Na verdade, o Rust contém vårias camadas de Biblioteca Padrão:
core
,alloc
estd
. core
inclui os tipos e funçÔes mais båsicos que não dependem delibc
, alocador ou até mesmo a presença de um sistema operacional.alloc
inclui tipos que requerem um alocador de heap global, comoVec
,Box
eArc
.- Os aplicativos Rust embarcados geralmente usam apenas
core
e, Ă s vezes,alloc
.
Option
e Result
Os tipos representam dados opcionais:
fn main() { let numbers = vec![10, 20, 30]; let first: Option<&i8> = numbers.first(); println!("primeiro: {first:?}"); let idx: Result<usize, usize> = numbers.binary_search(&10); println!("ind: {idx:?}"); }
Option
eResult
sĂŁo amplamente usados nĂŁo apenas na biblioteca padrĂŁo.Option<&T>
não tem nenhum custo adicional de espaço em comparação com&T
.Result
Ă© o tipo padrĂŁo para implementar tratamento de erros, como veremos no Dia 3.binary_search
retornaResult<usize, usize>
.- Se encontrado,
Result::Ok
contĂ©m o Ăndice onde o elemento foi encontrado. - Caso contrĂĄrio,
Result::Err
contĂ©m o Ăndice onde tal elemento deve ser inserido.
- Se encontrado,
String
String
Ă© o buffer padrĂŁo de cadeia de caracteres UTF-8 expansĂvel e alocado no heap:
fn main() { let mut s1 = String::new(); s1.push_str("OlĂĄ"); println!("s1: tam = {}, capacidade = {}", s1.len(), s1.capacity()); let mut s2 = String::with_capacity(s1.len() + 1); s2.push_str(&s1); s2.push('!'); println!("s2: tam = {}, capacidade = {}", s2.len(), s2.capacity()); let s3 = String::from("đ§đ·"); println!("s3: tam = {}, nĂșmero de caracteres = {}", s3.len(), s3.chars().count()); }
String
implementa Deref<Target = str>
, o que significa que vocĂȘ pode chamar todos os mĂ©todos de str
em uma String
.
String::new
retorna uma nova string vazia, useString::with_capacity
quando vocĂȘ sabe a quantidade de dados que vocĂȘ deseja colocar na string.String::len
retorna o tamanho daString
em bytes (que pode ser diferente de seu comprimento em caracteres).String::chars
retorna um iterador com os caracteres de fato. Observe que umchar
pode ser diferente do que um humano considerarĂĄ um âcaracterâ devido a agrupamentos de grafemas (grapheme clusters).- Quando as pessoas se referem a strings, elas podem estar falando sobre
&str
ouString
. - Quando um tipo implementa
Deref<Target = T>
, o compilador permitirĂĄ que vocĂȘ transparentemente chame mĂ©todos deT
.String
implementaDeref<Target = str>
que, de forma transparente, då acesso aos métodos destr
.- Escreva e compare
let s3 = s1.deref();
elet s3 = &*s1;
.
String
Ă© implementado como um wrapper em torno de um vetor de bytes, muitas das operaçÔes que vocĂȘ vĂȘ suportados em vetores tambĂ©m sĂŁo suportadas emString
, mas com algumas garantias extras.- Compare as diferentes formas de indexar uma
String
:- Para um caracter usando
s3.chars().nth(i).unwrap()
ondei
estĂĄ dentro dos limites, fora dos limites. - Para uma substring usando
s3[0..4]
, onde essa slice estĂĄ nos limites dos caracteres ou nĂŁo.
- Para um caracter usando
Vec
Vec
Ă© o buffer padrĂŁo redimensionĂĄvel alocado no heap:
fn main() { let mut v1 = Vec::new(); v1.push(42); println!("v1: tamanho = {}, capacidade = {}", v1.len(), v1.capacity()); let mut v2 = Vec::with_capacity(v1.len() + 1); v2.extend(v1.iter()); v2.push(9999); println!("v2: tamanho = {}, capacidade = {}", v2.len(), v2.capacity()); // Macro canÎnica para inicializar um vetor com elementos. let mut v3 = vec![0, 0, 1, 2, 3, 4]; // Mantém apenas os elementos pares. v3.retain(|x| x % 2 == 0); println!("{v3:?}"); // Remove duplicatas consecutivas. v3.dedup(); println!("{v3:?}"); }
Vec
implementa Deref<Target = [T]>
, o que significa que vocĂȘ pode chamar mĂ©todos de slice em um Vec
.
Vec
é um tipo de coleção, comoString
eHashMap
. Os dados que ele contém são armazenados no heap. Isso significa que a quantidade de dados não precisa ser conhecida em tempo de compilação. Ela pode crescer ou encolher em tempo de execução.- Observe como
Vec<T>
tambĂ©m Ă© um tipo genĂ©rico, mas vocĂȘ nĂŁo precisa especificarT
explicitamente. Como sempre, com a inferĂȘncia de tipos do Rust,T
foi estabelecido durante a primeira chamada depush
. vec![...]
Ă© uma macro canĂŽnica para usar em vez deVec::new()
e suporta a adição de elementos iniciais ao vetor.- Para indexar o vetor, vocĂȘ usa
[
]
, mas uma exceção do tipo pùnico (panic
) serĂĄ gerada se o Ăndice estiver fora dos limites. Alternativamente, usandoget
vocĂȘ obterĂĄ umOption
. A funçãopop
removerĂĄ o Ășltimo elemento. - Mostre uma iteração sobre um vetor e alterando o valor:
for e in &mut v { *e += 50; }
HashMap
Hash map (Mapa de hash) padrão com proteção contra ataques HashDoS:
use std::collections::HashMap; fn main() { let mut page_counts = HashMap::new(); page_counts.insert("Adventures of Huckleberry Finn".to_string(), 207); page_counts.insert("Grimms' Fairy Tales".to_string(), 751); page_counts.insert("Pride and Prejudice".to_string(), 303); if !page_counts.contains_key("Les Misérables") { println!("Nós sabemos sobre livros {}, mas não Les Misérables.", page_counts.len()); } for book in ["Pride and Prejudice", "Alice's Adventure in Wonderland"] { match page_counts.get(book) { Some(count) => println!("{book}: {count} påginas"), None => println!("{book} é desconhecido.") } } // Use o método .entry() para inserir um valor caso nada seja encontrado. for book in ["Pride and Prejudice", "Alice's Adventure in Wonderland"] { let page_count: &mut i32 = page_counts.entry(book.to_string()).or_insert(0); *page_count += 1; } println!("{page_counts:#?}"); }
-
HashMap
nĂŁo estĂĄ definido no prelĂșdio e precisa ser incluĂdo no escopo. -
Tente as seguintes linhas de cĂłdigo. A primeira linha verĂĄ se um livro estĂĄ no hash map e, caso nĂŁo esteja, retorna um valor alternativo. A segunda linha irĂĄ inserir o valor alternativo no hash map se o livro nĂŁo for encontrado.
let pc1 = page_counts .get("Harry Potter and the Sorcerer's Stone ") .unwrap_or(&336); let pc2 = page_counts .entry("The Hunger Games".to_string()) .or_insert(374);
-
Ao contrĂĄrio de
vec!
, infelizmente nĂŁo existe uma macrohashmap!
padrĂŁo.-
Entretanto, desde o Rust 1.56, o HashMap implementa
From<[(K, V); N]>
, o que nos permite inicializar facilmente um hash map a partir de uma matriz literal:let page_counts = HashMap::from([ ("Harry Potter and the Sorcerer's Stone".to_string(), 336), ("The Hunger Games".to_string(), 374), ]);
-
-
Alternativamente, o HashMap pode ser construĂdo a partir de qualquer
Iterator
que produz tuplas de chave-valor. -
Estamos mostrando
HashMap<String, i32>
, e evite usar&str
como chave para facilitar os exemplos. Ă claro que o uso de referĂȘncias em coleçÔes pode ser feito, mas isto pode levar a complicaçÔes com o verificador de emprĂ©stimos.- Tente remover
to_string()
do exemplo acima e veja se ele ainda compila. Onde vocĂȘ acha que podemos ter problemas?
- Tente remover
-
This type has several âmethod-specificâ return types, such as
std::collections::hash_map::Keys
. These types often appear in searches of the Rust docs. Show students the docs for this type, and the helpful link back to thekeys
method.
Box
Box
Ă© um ponteiro owned para dados no heap:
fn main() { let five = Box::new(5); println!("cinco: {}", *five); }
Box<T>
implementa Deref<Target = T>
, o que significa que vocĂȘ pode chamar mĂ©todos de T
diretamente em um Box<T>
.
Box
Ă© parecido comstd::unique_ptr
em C++, exceto que ele Ă© garantidamente nĂŁo nulo.- No exemplo acima, vocĂȘ pode atĂ© remover o
*
na instruçãoprintln!
graças aoDeref
. - Uma
Box
Ă© Ăștil quando vocĂȘ:- Tem um tipo cujo tamanho nĂŁo estĂĄ disponĂvel em tempo de compilação, mas o compilador Rust precisa saber o tamanho exato.
- Precisa transferir o ownership de um grande volume de dados. Ao invés de copiar grandes volumes de dados na pilha, eles são armazenados usando uma
Box
no heap e apenas o ponteiro Ă© movido.
Box
com Estruturas de Dados Recursivas
Tipos de dados recursivos ou tipos de dados com tamanhos dinĂąmicos precisam usar uma Box
:
#[derive(Debug)] enum List<T> { Cons(T, Box<List<T>>), Nil, } fn main() { let list: List<i32> = List::Cons(1, Box::new(List::Cons(2, Box::new(List::Nil)))); println!("{list:?}"); }
-
Se a
Box
nĂŁo for usada e tentarmos incorporar umaList
diretamente naList
, o compilador nĂŁo conseguiria calcular um tamanho fixo da struct na memĂłria (List
teria tamanho infinito) . -
Box
resolve esse problema, pois tem o mesmo tamanho de um ponteiro normal e apenas aponta para o prĂłximo elemento daList
no heap. -
Remova o
Box
na definição deList
e mostre o erro de compilação. âRecursive with indirectionâ (recursivo com indireção) Ă© uma dica para que vocĂȘ talvez queira usar umaBox
ou referĂȘncia de alguma forma, ao invĂ©s de armazenar um valor diretamente.
Otimização de Nicho
#[derive(Debug)] enum List<T> { Cons(T, Box<List<T>>), Nil, } fn main() { let list: List<i32> = List::Cons(1, Box::new(List::Cons(2, Box::new(List::Nil)))); println!("{list:?}"); }
Uma Box
nĂŁo pode estar vazia, portanto o ponteiro Ă© sempre vĂĄlido e nĂŁo nulo (null
). Isto permite que o compilador otimize o layout da memĂłria:
Rc
Rc
Ă© um ponteiro compartilhado com contagem de referĂȘncia. Use-o quando precisar consultar os mesmos dados a partir de vĂĄrios locais:
use std::rc::Rc; fn main() { let mut a = Rc::new(10); let mut b = Rc::clone(&a); println!("a: {a}"); println!("b: {b}"); }
- Veja
Arc
eMutex
se vocĂȘ estiver em um contexto multi-thread. - VocĂȘ pode demover (downgrade) um ponteiro compartilhado para um ponteiro
Weak
(fraco) para criar ciclos que serĂŁo descartados.
- O contador do
Rc
garante que os seus valores contidos sejam vĂĄlidos enquanto houver referĂȘncias. Rc
em Rust Ă© comostd::shared_ptr
em C++.Rc::clone
Ă© barato: ele cria um ponteiro para a mesma alocação e aumenta a contagem de referĂȘncia. Ele nĂŁo faz um âclone profundoâ (deep clone) e geralmente pode ser ignorado ao procurar problemas de desempenho no cĂłdigo.make_mut
realmente clona o valor interno se necessĂĄrio (âclone-on-writeâ) e retorna uma referĂȘncia mutĂĄvel.- Use
Rc::strong_count
para verificar a contagem de referĂȘncia. Rc::downgrade
lhe fornece um objeto contador de referĂȘncias âfracoâ (weak)_ para criar ciclos que podem ser apropriadamente descartados (provavelmente combinados comRefCell
, no prĂłximo slide).
Cell
e RefCell
Cell
e RefCell
implementam o que Rust chama de mutabilidade interior: mutação de valores em um contexto imutåvel.
Cell
Ă© normalmente usado para tipos simples, pois requer copiar ou mover valores. Tipos interiores mais complexos normalmente usam RefCell
, que rastreia referĂȘncias compartilhadas e exclusivas em tempo de execução e retorna um pĂąnico (panic) se forem mal utilizadas.
use std::cell::RefCell; use std::rc::Rc; #[derive(Debug, Default)] struct Node { value: i64, children: Vec<Rc<RefCell<Node>>>, } impl Node { fn new(value: i64) -> Rc<RefCell<Node>> { Rc::new(RefCell::new(Node { value, ..Node::default() })) } fn sum(&self) -> i64 { self.value + self.children.iter().map(|c| c.borrow().sum()).sum::<i64>() } } fn main() { let root = Node::new(1); root.borrow_mut().children.push(Node::new(5)); let subtree = Node::new(10); subtree.borrow_mut().children.push(Node::new(11)); subtree.borrow_mut().children.push(Node::new(12)); root.borrow_mut().children.push(subtree); println!("graph: {root:#?}"); println!("graph sum: {}", root.borrow().sum()); }
- Se estivéssemos usando
Cell
em vez deRefCell
neste exemplo, terĂamos que mover oNode
para fora doRc
para enviar os filhos e, em seguida, movĂȘ-lo de volta. Isso Ă© seguro porque sempre hĂĄ um, valor nĂŁo referenciado emcell
, mas nĂŁo Ă© ergonĂŽmico. - Para fazer qualquer coisa com um Node, vocĂȘ deve chamar um mĂ©todo
RefCell
, geralmenteborrow
ouborrow_mut
. - Demonstre que loops de referĂȘncia podem ser criados adicionando
root
asubtree.children
(não tente imprimi-lo!). - Para demonstrar um pùnico em tempo de execução, adicione um
fn inc(&mut self)
que incrementaself.value
e chama o mesmo mĂ©todo em seus filhos. Isso criarĂĄ um pĂąnico na presença do loop de referĂȘncia, comthread 'main' em pĂąnico no 'jĂĄ emprestado: BorrowMutError'
.
MĂłdulos
Vimos como os blocos impl
nos permitem usar namespaces (espaços de nomes) de funçÔes para um tipo.
Da mesma forma, mod
nos permite usar namespaces de tipos e funçÔes:
mod foo { pub fn do_something() { println!("No mĂłdulo foo"); } } mod bar { pub fn do_something() { println!("No mĂłdulo bar"); } } fn main() { foo::do_something(); bar::do_something(); }
- Pacotes (packages) fornecem funcionalidades e incluem um arquivo
Cargo.toml
que descreve como gerar um pacote com um ou mais crates. - Crates sĂŁo arvores de mĂłdulos, onde um crate binĂĄrio cria um executĂĄvel e um crate de biblioteca Ă© compilado em uma biblioteca.
- Módulos definem organização, escopo e são o foco desta seção.
Visibilidade
MĂłdulos sĂŁo limitadores de privacidade:
- Itens do módulo são privados por padrão (ocultam detalhes de implementação).
- Itens paternos e fraternos sĂŁo sempre visĂveis.
- Em outras palavras, se um item Ă© visĂvel no mĂłdulo
foo
, ele Ă© visĂvel em todos os descendentes defoo
.
mod outer { fn private() { println!("externo::privado"); } pub fn public() { println!("externo::publico"); } mod inner { fn private() { println!("externo::interno::privado"); } pub fn public() { println!("externo::interno::publico"); super::private(); } } } fn main() { outer::public(); }
- Use a palavra reservada
pub
para tornar mĂłdulos pĂșblicos.
Adicionamente, existem especificadores pub(...)
avançados para restringir o escopo de visibilidade pĂșblica.
- Veja a ReferĂȘncia Rust.
- A configuração de visibilidade
pub(crate)
Ă© um padrĂŁo comum. - Menos comum, vocĂȘ pode dar visibilidade para um caminho especĂfico.
- Em todo caso, a visibilidade deve ser concedida a um mĂłdulo ancestral (e a todos os seus descendentes).
Caminhos
Caminhos sĂŁo resolvidos da seguinte forma:
-
Como um caminho relativo:
foo
ouself::foo
referem-se Ăfoo
no mĂłdulo atual,super::foo
refere-se Ăfoo
no mĂłdulo pai.
-
Como um caminho absoluto:
crate::foo
refere-se Ăfoo
na raiz do crate atual,bar::foo
refere-se afoo
no cratebar
.
Um mĂłdulo pode trazer sĂmbolos de outro mĂłdulo para o escopo com use
. Normalmente, vocĂȘ verĂĄ algo assim na parte superior de cada mĂłdulo:
use std::collections::HashSet; use std::mem::transmute;
Hierarquia do Sistema de Arquivos
Omitir o conteĂșdo do mĂłdulo dirĂĄ ao Rust para procurĂĄ-lo em outro arquivo:
mod garden;
Isso diz ao Rust que o conteĂșdo do mĂłdulo jardim
pode ser encontrado em src/jardim.rs
. Similarmente, um mĂłdulo jardim::vegetais
pode ser encontrado em src/jardim/vegetais.rs
.
A raiz crate
estĂĄ em:
src/lib.rs
(para um crate de biblioteca)src/main.rs
(para um crate binĂĄrio)
MĂłdulos definidos em arquivos tambĂ©m podem ser documentados usando âcomentĂĄrios internos de documentoâ (inner doc comments). Estes documentam o item que os contĂ©m - neste caso, um mĂłdulo.
//! Este módulo implementa o jardim, incluindo uma implementação de germinação //! de alto desempenho. // Re-exporta tipos deste módulo. pub use seeds::SeedPacket; pub use garden::Garden; /// Semeia os pacotes de semente fornecidos. pub fn sow(seeds: Vec<SeedPacket>) { todo!() } /// Colhe os vegetais no jardim que estå pronto. pub fn harvest(garden: &mut Garden) { todo!() }
-
Antes do Rust 2018, os mĂłdulos precisavam estar localizados em
module/mod.rs
ao invés demodule.rs
, e esta ainda é uma alternativa funcional para ediçÔes posteriores a 2018. -
A principal razĂŁo para introduzir
nome_de_arquivo.rs
como alternativa anome_de_arquivo/mod.rs
foi porque muitos arquivos denominadosmod.rs
podem ser difĂceis de distinguir em IDEs. -
O aninhamento mais profundo pode usar pastas, mesmo que o mĂłdulo principal seja um arquivo:
src/ âââ main.rs âââ top_module.rs âââ top_module/ âââ sub_module.rs
-
O local no qual o Rust irĂĄ procurar por mĂłdulos pode ser alterado por meio de uma diretiva de compilador:
#[path = "algum/caminho.rs"] mod some_module;
Isto Ă© Ăștil, por exemplo, se vocĂȘ quiser colocar testes para um mĂłdulo em um arquivo chamado
algum_modulo_teste.rs
, semelhante à convenção em Go.
Dia 2: ExercĂcios da Tarde
Os exercĂcios desta tarde se concentrarĂŁo em strings e iteradores.
Depois de ver os exercĂcios, vocĂȘ pode ver as soluçÔes fornecidas.
Strings e Iteradores
Neste exercĂcio, vocĂȘ irĂĄ implementar um componente de roteamento de um servidor web. O servidor estĂĄ configurado com um nĂșmero de prefixos de caminhos que sĂŁo comparados com os caminhos requisitados. Os prefixos de caminho podem conter um caractere curinga que corresponde a um segmento completo. Veja os testes unitĂĄrios abaixo.
Copie o seguinte código para https://play.rust-lang.org/ e faça os testes passarem. Tente evitar alocar um Vec
para seus resultados intermediĂĄrios:
#![allow(unused)] fn main() { // TODO: remova isto quando vocĂȘ terminar sua implementação . #![allow(unused_variables, dead_code)] pub fn prefix_matches(prefix: &str, request_path: &str) -> bool { unimplemented!() } #[test] fn test_matches_without_wildcard() { assert!(prefix_matches("/v1/editores", "/v1/editores")); assert!(prefix_matches("/v1/editores", "/v1/editores/abc-123")); assert!(prefix_matches("/v1/editores", "/v1/editores/abc/livros")); assert!(!prefix_matches("/v1/editores", "/v1")); assert!(!prefix_matches("/v1/editores", "/v1/editoresLivros")); assert!(!prefix_matches("/v1/editores", "/v1/pai/editores")); } #[test] fn test_matches_with_wildcard() { assert!(prefix_matches( "/v1/editores/*/livros", "/v1/editores/foo/livros" )); assert!(prefix_matches( "/v1/editores/*/livros", "/v1/editores/bar/livros" )); assert!(prefix_matches( "/v1/editores/*/livros", "/v1/editores/foo/livros/livro1" )); assert!(!prefix_matches("/v1/editores/*/livros", "/v1/editores")); assert!(!prefix_matches( "/v1/editores/*/livros", "/v1/editores/foo/livrosPorAutor" )); } }
Bem-vindo ao Dia 3
Hoje, abordaremos alguns tópicos mais avançados em Rust:
-
Traits: deriving traits, default methods, and important standard library traits.
-
Generics: generic data types, generic methods, monomorphization, and trait objects.
-
Error handling: panics,
Result
, and the try operator?
. -
Testing: unit tests, documentation tests, and integration tests.
-
Unsafe Rust: raw pointers, static variables, unsafe functions, and extern functions.
Generics
Rust oferece suporte a tipos genéricos, que permitem algoritmos ou estruturas de dados (como ordenação ou årvore binåria) abstrair os tipos de dados usados ou armazenados.
Tipos de Dados Genéricos
VocĂȘ pode usar tipos genĂ©ricos para abstrair o tipo concreto do campo:
#[derive(Debug)] struct Point<T> { x: T, y: T, } fn main() { let integer = Point { x: 5, y: 10 }; let float = Point { x: 1.0, y: 4.0 }; println!("{integer:?} e {float:?}"); }
-
Tente declarar uma nova variĂĄvel
let p = Point { x: 5, y: 10.0 };
. -
Arrume o cĂłdigo para permitir pontos que tenham elementos de tipos diferentes.
Métodos Genéricos
VocĂȘ pode declarar um tipo genĂ©rico em seu bloco impl
:
#[derive(Debug)] struct Point<T>(T, T); impl<T> Point<T> { fn x(&self) -> &T { &self.0 // + 10 } // fn set_x(&mut self, x: T) } fn main() { let p = Point(5, 10); println!("p.x = {}", p.x()); }
- Pergunta: Por que
T
Ă© especificado duas vezes emimpl<T> Point<T> {}
? Isso não é redundante?- Isso ocorre porque é uma seção de implementação genérica para tipo genérico. Eles são genéricos de forma independente.
- Significa que esses métodos são definidos para qualquer
T
. - Ă possĂvel escrever
Impl Point<u32> { .. }
.Point
ainda Ă© genĂ©rico e vocĂȘ pode usarPoint<f64>
, mas os mĂ©todos neste bloco sĂł estarĂŁo disponĂveis paraPoint<u32>
.
Monomorfização
O código genérico é transformado em código não genérico de acordo com os tipos usados:
fn main() { let integer = Some(5); let float = Some(5.0); }
se comporta como se vocĂȘ tivesse escrito
enum Option_i32 { Some(i32), None, } enum Option_f64 { Some(f64), None, } fn main() { let integer = Option_i32::Some(5); let float = Option_f64::Some(5.0); }
Esta Ă© uma abstração de custo zero: vocĂȘ obtĂ©m exatamente o mesmo resultado como se tivesse codificado manualmente as estruturas de dados sem utilizar a abstração.
Traits
Rust permite abstrair caracterĂsticas dos tipos usando trait
. Eles sĂŁo semelhantes a interfaces:
trait Pet { fn name(&self) -> String; } struct Dog { name: String, } struct Cat; impl Pet for Dog { fn name(&self) -> String { self.name.clone() } } impl Pet for Cat { fn name(&self) -> String { String::from("Gato") // Sem nomes, gatos nĂŁo respondem mesmo. } } fn greet<P: Pet>(pet: &P) { println!("Quem Ă©? Ă o {}!", pet.name()); } fn main() { let fido = Dog { name: "Bidu".into() }; greet(&fido); let captain_floof = Cat; greet(&captain_floof); }
Objetos Trait
Objetos trait
permitem valores de diferentes tipos, por exemplo, em uma coleção:
trait Pet { fn name(&self) -> String; } struct Dog { name: String, } struct Cat; impl Pet for Dog { fn name(&self) -> String { self.name.clone() } } impl Pet for Cat { fn name(&self) -> String { String::from("Gato") // Sem nomes, gatos nĂŁo respondem mesmo. } } fn main() { let pets: Vec<Box<dyn Pet>> = vec![ Box::new(Cat), Box::new(Dog { name: String::from("Bidu") }), ]; for pet in pets { println!("OlĂĄ {}!", pet.name()); } }
Layout da memĂłria apĂłs alocar pets
:
- Tipos que implementam um dado
trait
podem ter tamanhos diferentes. Isto torna impossĂvel haver coisas comoVec<Pet>
no exemplo anterior. dyn Pet
Ă© uma maneira de dizer ao compilador sobre um tipo de tamanho dinĂąmico que implementaPet
.- No exemplo,
pets
possui fat pointers para objetos que implementamPet
. O fat pointer consiste em dois componentes, um ponteiro para o objeto propriamente dito e um ponteiro para a tabela de métodos virtuais para a implementação dePet
do objeto em particular. - Compare estas saĂdas no exemplo anterior::
println!("{} {}", std::mem::size_of::<Dog>(), std::mem::size_of::<Cat>()); println!("{} {}", std::mem::size_of::<&Dog>(), std::mem::size_of::<&Cat>()); println!("{}", std::mem::size_of::<&dyn Pet>()); println!("{}", std::mem::size_of::<Box<dyn Pet>>());
Traits Derivados
As macros derive
do Rust funcionam gerando automaticamente o cĂłdigo que implementa os traits especificados para uma estrutura de dados.
VocĂȘ pode deixar o compilador derivar uma sĂ©rie de traits tais como:
#[derive(Debug, Clone, PartialEq, Eq, Default)] struct Player { name: String, strength: u8, hit_points: u8, } fn main() { let p1 = Player::default(); let p2 = p1.clone(); println!("{:?} Ă©\nigual a {:?}?\nA resposta Ă© {}!", &p1, &p2, if p1 == p2 { "sim" } else { "nĂŁo" }); }
MĂ©todos PadrĂŁo
Traits podem implementar o comportamento em termos de outros métodos de trait
:
trait Equals { fn equals(&self, other: &Self) -> bool; fn not_equals(&self, other: &Self) -> bool { !self.equals(other) } } #[derive(Debug)] struct Centimeter(i16); impl Equals for Centimeter { fn equals(&self, other: &Centimeter) -> bool { self.0 == other.0 } } fn main() { let a = Centimeter(10); let b = Centimeter(20); println!("{a:?} igual a {b:?}: {}", a.equals(&b)); println!("{a:?} diferente de {b:?}: {}", a.not_equals(&b)); }
-
Traits podem especificar métodos pré-implementados (padrão) e métodos que os usuårios são obrigados a implementar. Os métodos com implementaçÔes padrão podem contar com os métodos requeridos.
-
Mova o método
not_equals
para um novo traitNotEquals
. -
Faça
Equals
um super trait paraNotEquals
.trait NotEquals: Equals { fn not_equals(&self, other: &Self) -> bool { !self.equals(other) } }
-
Forneça uma implementação geral de
NotEquals
paraEquals
.trait NotEquals { fn not_equals(&self, other: &Self) -> bool; } impl<T> NotEquals for T where T: Equals { fn not_equals(&self, other: &Self) -> bool { !self.equals(other) } }
- Com a implementação geral, vocĂȘ nĂŁo precisa mais de
Equals
como um super trait paraNotEqual
.
- Com a implementação geral, vocĂȘ nĂŁo precisa mais de
Limites de trait
Ao trabalhar com genĂ©ricos, muitas vezes vocĂȘ exigir que os tipos implementem algum trait
para poder utilizar os métodos do trait
.
VocĂȘ consegue fazer isso com T:Trait
ou impl Trait
:
fn duplicate<T: Clone>(a: T) -> (T, T) { (a.clone(), a.clone()) } // Syntactic sugar for: // fn add_42_millions<T: Into<i32>>(x: T) -> i32 { fn add_42_millions(x: impl Into<i32>) -> i32 { x.into() + 42_000_000 } // struct NotClonable; fn main() { let foo = String::from("foo"); let pair = duplicate(foo); println!("{pair:?}"); let many = add_42_millions(42_i8); println!("{many}"); let many_more = add_42_millions(10_000_000); println!("{many_more}"); }
Mostre uma clĂĄusula where
, os estudantes irĂŁo encontrĂĄ-la quando lerem cĂłdigo.
fn duplicate<T>(a: T) -> (T, T)
where
T: Clone,
{
(a.clone(), a.clone())
}
- Organiza a assinatura da função se vocĂȘ tiver muitos parĂąmetros.
- Possui recursos adicionais tornando-o mais poderoso.
- Se alguĂ©m perguntar, o recurso extra Ă© que o tipo Ă esquerda de â:â pode ser arbitrĂĄrio, como
Option<T>
.
- Se alguĂ©m perguntar, o recurso extra Ă© que o tipo Ă esquerda de â:â pode ser arbitrĂĄrio, como
Trait impl
Semelhante aos limites do trait, a sintaxe do trait impl
pode ser usada em argumentos de funçÔes e em valores de retorno:
use std::fmt::Display; fn get_x(name: impl Display) -> impl Display { format!("OlĂĄ {name}") } fn main() { let x = get_x("foo"); println!("{x}"); }
impl Trait
permite que vocĂȘ trabalhe com tipos que vocĂȘ nĂŁo pode nomear.
O significado do trait impl
é um pouco difere de acordo com sua posição.
-
For a parameter,
impl Trait
is like an anonymous generic parameter with a trait bound. -
For a return type, it means that the return type is some concrete type that implements the trait, without naming the type. This can be useful when you donât want to expose the concrete type in a public API.
Inference is hard in return position. A function returning
impl Foo
picks the concrete type it returns, without writing it out in the source. A function returning a generic type likecollect<B>() -> B
can return any type satisfyingB
, and the caller may need to choose one, such as withlet x: Vec<_> = foo.collect()
or with the turbofish,foo.collect::<Vec<_>>()
.
Este exemplo Ă© Ăłtimo, porque usa impl Display
duas vezes. Isso ajuda a explicar que nada impÔe que, nos dois usos, impl Display
seja do mesmo tipo. Se usĂĄssemos um Ășnico T: Display
, imporia a restrição de que o tipo T
de entrada e o tipo T
de retorno sĂŁo do mesmo tipo. Isso nĂŁo funcionaria para esta função especĂfica, pois o tipo que esperamos como entrada provavelmente nĂŁo Ă© o que format!
retorna. Se quiséssemos fazer o mesmo através da sintaxe : Display
, precisarĂamos de dois parĂąmetros genĂ©ricos independentes.
Traits Importantes
Veremos agora os Traits mais comuns da biblioteca padrĂŁo do Rust:
Iterator
eIntoIterator
usados em laçosfor
,From
eInto
usados na converção de valores,Read
eWrite
usados em operaçÔes de IO,Add
,Mul
, ⊠usado na sobrecarga de operadores,Drop
usado para definir destrutores eDefault
usado para construir uma instĂąncia padrĂŁo para um tipo.
Iteradores
VocĂȘ pode implementar o trait Iterator
em seus prĂłprios tipos:
struct Fibonacci { curr: u32, next: u32, } impl Iterator for Fibonacci { type Item = u32; fn next(&mut self) -> Option<Self::Item> { let new_next = self.curr + self.next; self.curr = self.next; self.next = new_next; Some(self.curr) } } fn main() { let fib = Fibonacci { curr: 0, next: 1 }; for (i, n) in fib.enumerate().take(5) { println!("fib({i}): {n}"); } }
-
The
Iterator
trait implements many common functional programming operations over collections (e.g.map
,filter
,reduce
, etc). This is the trait where you can find all the documentation about them. In Rust these functions should produce the code as efficient as equivalent imperative implementations. -
IntoIterator
is the trait that makes for loops work. It is implemented by collection types such asVec<T>
and references to them such as&Vec<T>
and&[T]
. Ranges also implement it. This is why you can iterate over a vector withfor i in some_vec { .. }
butsome_vec.next()
doesnât exist.
FromIterator
FromIterator
permite construir uma coleção a partir de um Iterator
.
fn main() { let primes = vec![2, 3, 5, 7]; let prime_squares = primes .into_iter() .map(|prime| prime * prime) .collect::<Vec<_>>(); }
Iterator
implementa fn collect<B>(self) -> B where B: FromIterator<Self::Item>, Self: Sized
Também existem implementaçÔes que permitem fazer coisas legais como converter um Iterator<Item = Result<V, E>>
em um Result<Vec<V>, E>
.
From
e Into
Os tipos implementam From
e Into
para facilitar as conversÔes de tipo:
fn main() { let s = String::from("olĂĄ"); let addr = std::net::Ipv4Addr::from([127, 0, 0, 1]); let one = i16::from(true); let bigger = i32::from(123i16); println!("{s}, {addr}, {one}, {bigger}"); }
Into
Ă© implementado automaticamente quando From
Ă© implementado:
fn main() { let s: String = "olĂĄ".into(); let addr: std::net::Ipv4Addr = [127, 0, 0, 1].into(); let one: i16 = true.into(); let bigger: i32 = 123i16.into(); println!("{s}, {addr}, {one}, {bigger}"); }
- Ă por isso que Ă© comum implementar apenas
From
, jå que seu tipo também receberå a implementação deInto
. - Ao declarar um tipo de entrada de argumento de função como âqualquer coisa que possa ser convertida em
String
â, a regra Ă© oposta, vocĂȘ deve usarInto
. Sua função aceitarå tipos que implementamFrom
e aqueles que apenas implementamInto
.
Read
e Write
Usando Read
e BufRead
, vocĂȘ pode abstrair a leitura de conteĂșdos do tipo u8
:
use std::io::{BufRead, BufReader, Read, Result}; fn count_lines<R: Read>(reader: R) -> usize { let buf_reader = BufReader::new(reader); buf_reader.lines().count() } fn main() -> Result<()> { let slice: &[u8] = b"foo\nbar\nbaz\n"; println!("lines in slice: {}", count_lines(slice)); let file = std::fs::File::open(std::env::current_exe()?)?; println!("lines in file: {}", count_lines(file)); Ok(()) }
Da mesma forma, Write
permite abstrair a escrita de dados do tipo u8
:
use std::io::{Result, Write}; fn log<W: Write>(writer: &mut W, msg: &str) -> Result<()> { writer.write_all(msg.as_bytes())?; writer.write_all("\n".as_bytes()) } fn main() -> Result<()> { let mut buffer = Vec::new(); log(&mut buffer, "OlĂĄ")?; log(&mut buffer, "Mundo")?; println!("Logged: {:?}", buffer); Ok(()) }
O Trait Drop
Valores que implementam Drop
podem especificar o cĂłdigo a ser executado quando saem do escopo:
struct Droppable { name: &'static str, } impl Drop for Droppable { fn drop(&mut self) { println!("Dropping {}", self.name); } } fn main() { let a = Droppable { name: "a" }; { let b = Droppable { name: "b" }; { let c = Droppable { name: "c" }; let d = Droppable { name: "d" }; println!("Exiting block B"); } println!("Exiting block A"); } drop(a); println!("Exiting main"); }
Pontos de discussĂŁo:
- Por que
Drop::drop
nĂŁo recebeself
?- Resposta curta: Se recebesse,
std::mem::drop
seria chamado no final do bloco, resultando em outra chamada paraDrop::drop
ocasionando um estouro de pilha.
- Resposta curta: Se recebesse,
- Tente substituir
drop(a)
pora.drop()
.
O Trait Default
O trait Default
fornece uma implementação padrão para um tipo.
#[derive(Debug, Default)] struct Derived { x: u32, y: String, z: Implemented, } #[derive(Debug)] struct Implemented(String); impl Default for Implemented { fn default() -> Self { Self("John Smith".into()) } } fn main() { let default_struct = Derived::default(); println!("{default_struct:#?}"); let almost_default_struct = Derived { y: "Y is set!".into(), ..Derived::default() }; println!("{almost_default_struct:#?}"); let nothing: Option<Derived> = None; println!("{:#?}", nothing.unwrap_or_default()); }
- Ele pode ser implementado diretamente ou derivado usando
#[derive(Default)]
. - A implementação usando
derive
produz um valor onde todos os campos sĂŁo preenchidos com seus valores padrĂŁo.- Consequentemente, todos os tipos usados na estrutuda devem implementar
Default
também.
- Consequentemente, todos os tipos usados na estrutuda devem implementar
- Frequentemente, os tipos padrĂŁo do Rust implementam
Default
com valores razoĂĄveis (ex:0
,""
, etc). - A cĂłpia parcial de estrututas funciona bem em conjunto com default.
- A bilioteca padrĂŁo do Rust sabe que tipos podem implementar o
trait
Default
e, convenientemente, provĂȘ mĂ©todos para isso. - the
..
syntax is called struct update syntax
Add
, Mul
, âŠ
A sobrecarga de operadores Ă© implementada por meio do trait
contido em std::ops
:
#[derive(Debug, Copy, Clone)] struct Point { x: i32, y: i32 } impl std::ops::Add for Point { type Output = Self; fn add(self, other: Self) -> Self { Self {x: self.x + other.x, y: self.y + other.y} } } fn main() { let p1 = Point { x: 10, y: 20 }; let p2 = Point { x: 100, y: 200 }; println!("{:?} + {:?} = {:?}", p1, p2, p1 + p2); }
Pontos de discussĂŁo:
- You could implement
Add
for&Point
. In which situations is that useful?- Answer:
Add:add
consumesself
. If typeT
for which you are overloading the operator is notCopy
, you should consider overloading the operator for&T
as well. This avoids unnecessary cloning on the call site.
- Answer:
- Why is
Output
an associated type? Could it be made a type parameter of the method?- Short answer: Function type parameters are controlled by the caller, but associated types (like
Output
) are controlled by the implementor of a trait.
- Short answer: Function type parameters are controlled by the caller, but associated types (like
- You could implement
Add
for two different types, e.g.impl Add<(i32, i32)> for Point
would add a tuple to aPoint
.
Closures
Closures ou expressĂ”es lambda tĂȘm tipos que nĂŁo podem ser nomeados. No entanto, eles implementam os traits especiais Fn
, FnMut
e FnOnce
:
fn apply_with_log(func: impl FnOnce(i32) -> i32, input: i32) -> i32 { println!("Calling function on {input}"); func(input) } fn main() { let add_3 = |x| x + 3; println!("add_3: {}", apply_with_log(add_3, 10)); println!("add_3: {}", apply_with_log(add_3, 20)); let mut v = Vec::new(); let mut accumulate = |x: i32| { v.push(x); v.iter().sum::<i32>() }; println!("accumulate: {}", apply_with_log(&mut accumulate, 4)); println!("accumulate: {}", apply_with_log(&mut accumulate, 5)); let multiply_sum = |x| x * v.into_iter().sum::<i32>(); println!("multiply_sum: {}", apply_with_log(multiply_sum, 3)); }
Um Fn
nĂŁo consome nem muda os valores capturados ou talvez nĂŁo capture nada, entĂŁo, pode ser chamado vĂĄrias vezes simultaneamente.
Um FnMut
pode alterar os valores capturados, entĂŁo vocĂȘ pode chamĂĄ-lo vĂĄrias vezes, mas nĂŁo simultaneamente.
Se vocĂȘ tiver um FnOnce
, poderĂĄ chamĂĄ-lo apenas uma vez. Pode consumir os valores capturados.
FnMut
Ă© um subtipo de FnOnce
. Fn
Ă© um subtipo de FnMut
e FnOnce
. Ou seja vocĂȘ pode usar um FnMut
sempre que um FnOnce
Ă© chamado e vocĂȘ pode usar um Fn
sempre que um FnMut
ou um FnOnce
Ă© chamado.
The compiler also infers Copy
(e.g. for add_3
) and Clone
(e.g. multiply_sum
), depending on what the closure captures.
By default, closures will capture by reference if they can. The move
keyword makes them capture by value.
fn make_greeter(prefix: String) -> impl Fn(&str) { return move |name| println!("{} {}", prefix, name) } fn main() { let hi = make_greeter("Hi".to_string()); hi("there"); }
Dia 3: ExercĂcios matinais
We will design a classical GUI library using traits and trait objects.
We will also look at enum dispatch with an exercise involving points and polygons.
Depois de ver os exercĂcios, vocĂȘ pode ver as soluçÔes fornecidas.
Uma Biblioteca GUI Simples
Vamos projetar uma biblioteca GUI clĂĄssica usando nosso novo conhecimento de traits e objetos de trait
.
Teremos vĂĄrios widgets em nossa biblioteca:
Window
: tem umtĂtulo
e contém outros widgets.Button
: tem umrĂłtulo
e uma função de callback que é invocada quando o botão é pressionado.Label
: tem umrĂłtulo
.
Os widgets irĂŁo implementar o trait
Widget
, veja abaixo.
Copie o código abaixo para https://play.rust-lang.org/, codifique os métodos draw_into
para que vocĂȘ implemente o trait
Widget
:
// TODO: remova isto quando vocĂȘ terminar sua implementação . #![allow(unused_imports, unused_variables, dead_code)] pub trait Widget { /// Natural width of `self`. fn width(&self) -> usize; /// Draw the widget into a buffer. fn draw_into(&self, buffer: &mut dyn std::fmt::Write); /// Draw the widget on standard output. fn draw(&self) { let mut buffer = String::new(); self.draw_into(&mut buffer); println!("{buffer}"); } } pub struct Label { label: String, } impl Label { fn new(label: &str) -> Label { Label { label: label.to_owned(), } } } pub struct Button { label: Label, callback: Box<dyn FnMut()>, } impl Button { fn new(label: &str, callback: Box<dyn FnMut()>) -> Button { Button { label: Label::new(label), callback, } } } pub struct Window { title: String, widgets: Vec<Box<dyn Widget>>, } impl Window { fn new(title: &str) -> Window { Window { title: title.to_owned(), widgets: Vec::new(), } } fn add_widget(&mut self, widget: Box<dyn Widget>) { self.widgets.push(widget); } fn inner_width(&self) -> usize { std::cmp::max( self.title.chars().count(), self.widgets.iter().map(|w| w.width()).max().unwrap_or(0), ) } } impl Widget for Label { fn width(&self) -> usize { unimplemented!() } fn draw_into(&self, buffer: &mut dyn std::fmt::Write) { unimplemented!() } } impl Widget for Button { fn width(&self) -> usize { unimplemented!() } fn draw_into(&self, buffer: &mut dyn std::fmt::Write) { unimplemented!() } } impl Widget for Window { fn width(&self) -> usize { unimplemented!() } fn draw_into(&self, buffer: &mut dyn std::fmt::Write) { unimplemented!() } } fn main() { let mut window = Window::new("Rust GUI Demo 1.23"); window.add_widget(Box::new(Label::new("This is a small text GUI demo."))); window.add_widget(Box::new(Button::new( "Click me!", Box::new(|| println!("You clicked the button!")), ))); window.draw(); }
A saĂda do programa acima pode ser algo simples como:
========
Rust GUI Demo 1.23
========
This is a small text GUI demo.
| Click me! |
Se vocĂȘ quiser desenhar texto alinhado, vocĂȘ pode usar os operadores de formatação fill/alignment. Em particular, observe como vocĂȘ pode preencher com diferentes caracteres (aqui um '/'
) e como vocĂȘ pode controlar o alinhamento:
fn main() { let width = 10; println!("alinhado Ă esquerda: |{:/<width$}|", "foo"); println!("centralizado: |{:/^width$}|", "foo"); println!("alinhado Ă direita: |{:/>width$}|", "foo"); }
Usando esses truques de alinhamento, vocĂȘ pode, por exemplo, produzir uma saĂda como esta:
+--------------------------------+
| Rust GUI Demo 1.23 |
+================================+
| This is a small text GUI demo. |
| +-----------+ |
| | Click me! | |
| +-----------+ |
+--------------------------------+
Struct para PolĂgono
Vamos criar um struct Polygon
que contém alguns Points
. Copie o código abaixo em https://play.rust-lang.org/ e preencha os métodos que faltam para fazer os testes passarem:
// TODO: remova isto quando vocĂȘ terminar sua implementação . #![allow(unused_variables, dead_code)] pub struct Point { // adicione atributos } impl Point { // adicione mĂ©todos } pub struct Polygon { // adicione atributos } impl Polygon { // adicione mĂ©todos } pub struct Circle { // adicione atributos } impl Circle { // adicione mĂ©todos } pub enum Shape { Polygon(Polygon), Circle(Circle), } #[cfg(test)] mod tests { use super::*; fn round_two_digits(x: f64) -> f64 { (x * 100.0).round() / 100.0 } #[test] fn test_point_magnitude() { let p1 = Point::new(12, 13); assert_eq!(round_two_digits(p1.magnitude()), 17.69); } #[test] fn test_point_dist() { let p1 = Point::new(10, 10); let p2 = Point::new(14, 13); assert_eq!(round_two_digits(p1.dist(p2)), 5.00); } #[test] fn test_point_add() { let p1 = Point::new(16, 16); let p2 = p1 + Point::new(-4, 3); assert_eq!(p2, Point::new(12, 19)); } #[test] fn test_polygon_left_most_point() { let p1 = Point::new(12, 13); let p2 = Point::new(16, 16); let mut poly = Polygon::new(); poly.add_point(p1); poly.add_point(p2); assert_eq!(poly.left_most_point(), Some(p1)); } #[test] fn test_polygon_iter() { let p1 = Point::new(12, 13); let p2 = Point::new(16, 16); let mut poly = Polygon::new(); poly.add_point(p1); poly.add_point(p2); let points = poly.iter().cloned().collect::<Vec<_>>(); assert_eq!(points, vec![Point::new(12, 13), Point::new(16, 16)]); } #[test] fn test_shape_perimeters() { let mut poly = Polygon::new(); poly.add_point(Point::new(12, 13)); poly.add_point(Point::new(17, 11)); poly.add_point(Point::new(16, 16)); let shapes = vec![ Shape::from(poly), Shape::from(Circle::new(Point::new(10, 20), 5)), ]; let perimeters = shapes .iter() .map(Shape::perimeter) .map(round_two_digits) .collect::<Vec<_>>(); assert_eq!(perimeters, vec![15.48, 31.42]); } } #[allow(dead_code)] fn main() {}
Como as assinaturas dos mĂ©todos estĂŁo faltando nas declaraçÔes do problema, a parte principal do exercĂcio Ă© especificĂĄ-las corretamente. NĂŁo Ă© preciso modificar os testes.
Outras partes interessante do exercĂcio:
- Derive um trait
Copy
para algumas structs, jå que em testes os métodos às vezes não emprestam seus argumentos. - Descubra que o trait
Add
deve ser implementado para que dois objetos sejam adicionados via â+â. Note que nĂłs nĂŁo discutimos generics atĂ© o Dia 3.
Tratamento de Erros
O tratamento de erros em Rust Ă© feito usando fluxo de controle explĂcito:
- FunçÔes que podem ter erros mostram isso em seu tipo de retorno.
- Não hå exceçÔes (exceptions).
Panics (PĂąnico)
O Rust irå disparar um panic (pùnico) se um erro fatal ocorrer em tempo de execução:
fn main() { let v = vec![10, 20, 30]; println!("v[100]: {}", v[100]); }
- PĂąnicos sĂŁo para erros irrecuperĂĄveis e inesperados.
- PĂąnicos sĂŁo sintomas de bugs no programa.
- Use APIs que nĂŁo disparam erros do tipo pĂąnico (como
Vec::get
) se nĂŁo for aceitĂĄvel o travamento do programa.
Capturando a Resolução da Pilha (Stack Unwinding)
Por padrão, um pùnico causarå a resolução da pilha. A resolução pode ser capturada:
use std::panic; fn main() { let result = panic::catch_unwind(|| { println!("olĂĄ!"); }); assert!(result.is_ok()); let result = panic::catch_unwind(|| { panic!("ah nĂŁo!"); }); assert!(result.is_err()); }
- Isso pode ser Ăștil em servidores que devem continuar rodando mesmo se uma requisição tenha falhado.
- Isso nĂŁo funciona se
panic = 'abort'
estiver definido em seuCargo.toml
.
Tratamento Estruturado de Erros com Result
JĂĄ vimos o enum Result
. Ele é usado amplamente quando os erros são esperados como parte da operação normal:
use std::fs; use std::io::Read; fn main() { let file = fs::File::open("diario.txt"); match file { Ok(mut file) => { let mut contents = String::new(); file.read_to_string(&mut contents); println!("Querido diĂĄrio: {contents}"); }, Err(err) => { println!("NĂŁo foi possĂvel abrir o diĂĄrio: {err}"); } } }
- Como em
Option
, o valor bem-sucedido fica dentro deResult
, forçando o desenvolvedor a extraĂ-lo explicitamente. Isso encoraja a verificação de erros. No caso em que um erro nunca deve acontecer,unwrap()
ouexpect()
podem ser chamados, e isso também sinaliza a intenção do desenvolvedor. - A documentação de
Result
Ă© uma leitura recomendada. NĂŁo durante o curso, mas vale a pena mencionĂĄ-la. Ele contĂ©m muitos mĂ©todos e funçÔes de conveniĂȘncia que ajudam na programação ao estilo funcional.
Propagando Erros com ?
O operador try ?
é usado para retornar erros ao chamador da função. Se ocorrer um erro, este é retornado imediatamente ao chamador como retorno da função.
match some_expression {
Ok(value) => value,
Err(err) => return Err(err),
}
O cĂłdigo acima pode ser simplificado para:
some_expression?
Podemos usar isso para simplificar nosso cĂłdigo de tratamento de erros:
use std::{fs, io}; use std::io::Read; fn read_username(path: &str) -> Result<String, io::Error> { let username_file_result = fs::File::open(path); let mut username_file = match username_file_result { Ok(file) => file, Err(err) => return Err(err), }; let mut username = String::new(); match username_file.read_to_string(&mut username) { Ok(_) => Ok(username), Err(err) => Err(err), } } fn main() { //fs::write("config.dat", "alice").unwrap(); let username = read_username("config.dat"); println!("nome_usuario ou erro: {username:?}"); }
Pontos chave:
- A variĂĄvel
nome_usuario
pode serOk(string)
ouErr(error)
. - Use a chamada
fs::write
para testar os diferentes cenĂĄrios: nenhum arquivo, arquivo vazio e arquivo com nome de usuĂĄrio. - The return type of the function has to be compatible with the nested functions it calls. For instance, a function returning a
Result<T, Err>
can only apply the?
operator on a function returning aResult<AnyT, Err>
. It cannot apply the?
operator on a function returning anOption<AnyT>
orResult<T, OtherErr>
unlessOtherErr
implementsFrom<Err>
. Reciprocally, a function returning anOption<T>
can only apply the?
operator on a function returning anOption<AnyT>
.- You can convert incompatible types into one another with the different
Option
andResult
methods such asOption::ok_or
,Result::ok
,Result::err
.
- You can convert incompatible types into one another with the different
Convertendo Tipos de Erro
A expansĂŁo efetiva do operador ?
Ă© um pouco mais complicada do que indicado anteriormente:
expression?
funciona da mesma forma que
match expression {
Ok(value) => value,
Err(err) => return Err(From::from(err)),
}
A chamada From::from
aqui significa que tentamos converter o tipo de erro para o tipo retornado pela função:
Convertendo Tipos de Erro
use std::error::Error; use std::fmt::{self, Display, Formatter}; use std::fs::{self, File}; use std::io::{self, Read}; #[derive(Debug)] enum ReadUsernameError { IoError(io::Error), EmptyUsername(String), } impl Error for ReadUsernameError {} impl Display for ReadUsernameError { fn fmt(&self, f: &mut Formatter) -> fmt::Result { match self { Self::IoError(e) => write!(f, "Erro E/S: {e}"), Self::EmptyUsername(filename) => write!(f, "Nome de usuĂĄrio nĂŁo encontrado em {filename}"), } } } impl From<io::Error> for ReadUsernameError { fn from(err: io::Error) -> ReadUsernameError { ReadUsernameError::IoError(err) } } fn read_username(path: &str) -> Result<String, ReadUsernameError> { let mut username = String::with_capacity(100); File::open(path)?.read_to_string(&mut username)?; if username.is_empty() { return Err(ReadUsernameError::EmptyUsername(String::from(path))); } Ok(username) } fn main() { //fs::write("config.dat", "").unwrap(); let username = read_username("config.dat"); println!("nome_usuario ou erro: {username:?}"); }
Pontos chave:
- A variĂĄvel
nome_usuario
pode serOk(string)
ouErr(error)
. - Use a chamada
fs::write
para testar os diferentes cenĂĄrios: nenhum arquivo, arquivo vazio e arquivo com nome de usuĂĄrio.
Ă uma boa prĂĄtica para todos os tipos de erro que nĂŁo precisam ser no_std
implementar std::error::Error
, que requer Debug
e Display
. O crate Error
para core
sĂł estĂĄ disponĂvel em nightly, entĂŁo ainda nĂŁo Ă© totalmente compatĂvel com no_std
.
Geralmente Ă© Ăștil para eles implementar Clone
e Eq
tambĂ©m quando possĂvel, para tornar mais fĂĄcil a vida para testes e consumidores da sua biblioteca. Neste caso, nĂŁo podemos fazĂȘ-lo facilmente, porque io::Error
nĂŁo os implementa.
Derivando Enums de Erro
O crate thiserror Ă© uma maneira popular de criar um tipo enumerado (enum) de erro, como fizemos na pĂĄgina anterior:
use std::{fs, io}; use std::io::Read; use thiserror::Error; #[derive(Debug, Error)] enum ReadUsernameError { #[error("NĂŁo Ă© possivel ler: {0}")] IoError(#[from] io::Error), #[error("Nome de usuĂĄrio nĂŁo encontrado em {0}")] EmptyUsername(String), } fn read_username(path: &str) -> Result<String, ReadUsernameError> { let mut username = String::new(); fs::File::open(path)?.read_to_string(&mut username)?; if username.is_empty() { return Err(ReadUsernameError::EmptyUsername(String::from(path))); } Ok(username) } fn main() { //fs::write("config.dat", "").unwrap(); match read_username("config.dat") { Ok(username) => println!("Nome do usuĂĄrio: {nome_usuario}"), Err(err) => println!("Erro: {err}"), } }
A derive macro thiserror
implementa automaticamente std::error::Error
, e opcionalmente, Display
(se os atributos #[error(...)]
forem fornecidos) e From
(se o atributo #[from]
for adicionado). Também funciona para structs.
NĂŁo afeta sua API pĂșblica, o que a torna boa para bibliotecas.
Tipos de Erros DinĂąmicos
Ăs vezes, queremos permitir que qualquer tipo de erro seja retornado sem escrever nosso prĂłprio Enum
abrangendo todas as diferentes possibilidades. std::error::Error
torna isso fĂĄcil.
use std::fs; use std::io::Read; use thiserror::Error; use std::error::Error; #[derive(Clone, Debug, Eq, Error, PartialEq)] #[error("Nome de usuĂĄrio nĂŁo encontrado em {0}")] struct EmptyUsernameError(String); fn read_username(path: &str) -> Result<String, Box<dyn Error>> { let mut username = String::new(); fs::File::open(path)?.read_to_string(&mut username)?; if username.is_empty() { return Err(EmptyUsernameError(String::from(path)).into()); } Ok(username) } fn main() { //fs::write("config.dat", "").unwrap(); match read_username("config.dat") { Ok(username) => println!("Nome do usuĂĄrio: {nome_usuario}"), Err(err) => println!("Erro: {err}"), } }
Isso economiza cĂłdigo, mas abre mĂŁo da capacidade de lidar com diferentes casos de erro de maneira diferenciada no programa. Como tal, geralmente nĂŁo Ă© uma boa ideia usar Box<dyn Error>
na API pĂșblica de uma biblioteca, mas pode ser uma boa opção em um programa onde vocĂȘ deseja apenas exibir a mensagem de erro em algum lugar.
Adicionando Contexto aos Erros
O crate
anyhow Ă© amplamente usado e pode lhe ajudar a adicionar informaçÔes contextuais aos seus erros, permitindo que vocĂȘ tenha menos tipos de erros personalizados:
use std::{fs, io}; use std::io::Read; use anyhow::{Context, Result, bail}; fn read_username(path: &str) -> Result<String> { let mut username = String::with_capacity(100); fs::File::open(path) .with_context(|| format!("Falha ao abrir {caminho}"))? .read_to_string(&mut username) .context("Falha ao ler")?; if username.is_empty() { bail!("Nome de usuĂĄrio nĂŁo encontrado em {path}"); } Ok(username) } fn main() { //fs::write("config.dat", "").unwrap(); match read_username("config.dat") { Ok(username) => println!("Nome do usuĂĄrio: {nome_usuario}"), Err(err) => println!("Erro: {err:?}"), } }
anyhow::Result<V>
Ă© um apelido de tipo paraResult<V, anyhow::Error>
.anyhow::Error
Ă© essencialmente um wrapper em torno deBox<dyn Error>
. Como tal, geralmente nĂŁo Ă© uma boa escolha para a API pĂșblica de uma biblioteca, mas Ă© amplamente utilizado em aplicaçÔes.- O tipo de erro real dentro dele pode ser extraĂdo para exame, se necessĂĄrio.
- A funcionalidade fornecida por
anyhow::Result<T>
pode ser familiar para desenvolvedores Go, pois fornece padrÔes de uso e ergonomia semelhantes a(T, error)
de Go.
Testando
Rust e Cargo vĂȘm com uma estrutura de testes unitĂĄrios simples:
-
Testes unitĂĄrios sĂŁo suportados em todo o seu cĂłdigo.
-
Testes de integração são suportados através do diretório
tests/
.
Testes UnitĂĄrios
Marque os testes unitĂĄrios com #[test]
:
fn first_word(text: &str) -> &str {
match text.find(' ') {
Some(idx) => &text[..idx],
None => &text,
}
}
#[test]
fn test_empty() {
assert_eq!(first_word(""), "");
}
#[test]
fn test_single_word() {
assert_eq!(first_word("OlĂĄ"), "OlĂĄ");
}
#[test]
fn test_multiple_words() {
assert_eq!(first_word("Hello World"), "OlĂĄ");
}
Use cargo test
para encontrar e executar os testes unitĂĄrios.
MĂłdulos de Teste
Testes unitĂĄrios geralmente sĂŁo colocados em um mĂłdulo aninhado (execute testes no Playground):
fn helper(a: &str, b: &str) -> String { format!("{a} {b}") } pub fn main() { println!("{}", helper("OlĂĄ", "Mundo")); } #[cfg(test)] mod tests { use super::*; #[test] fn test_helper() { assert_eq!(helper("foo", "bar"), "foo bar"); } }
- Isso permite que vocĂȘ tenha testes unitĂĄrios auxiliares privados.
- O atributo
#[cfg(test)]
somente fica ativo quando vocĂȘ executacargo test
.
Testes de Documentação
Rust tem suporte embutido para testes de documentação:
#![allow(unused)] fn main() { /// Encurta uma string para o comprimento especificado. /// /// ``` /// use playground::encurtar_string; /// assert_eq!(encurtar_string("OlĂĄ Mundo", 4), "OlĂĄ"); /// assert_eq!(encurtar_string("OlĂĄ Mundo", 20), "OlĂĄ Mundo"); /// ``` pub fn shorten_string(s: &str, length: usize) -> &str { &s[..std::cmp::min(length, s.len())] } }
- Blocos de cĂłdigo em comentĂĄrios
///
sĂŁo vistos automaticamente como cĂłdigo Rust. - O cĂłdigo serĂĄ compilado e executado como parte do
cargo test
. - Teste o cĂłdigo acima no Rust Playground.
Testes de Integração
Se quiser testar sua biblioteca como um cliente, use um teste de integração.
Crie um arquivo .rs
em tests/
:
use my_library::init;
#[test]
fn test_init() {
assert!(init().is_ok());
}
Esses testes tĂȘm acesso somente Ă API pĂșblica do seu crate
.
Crates Ăteis para Escrever Testes
Rust possui apenas suporte bĂĄsico para escrever testes.
Estes sĂŁo alguns crates adicionais que recomendamos para a escrita de testes:
- googletest: Biblioteca abrangente para testes de assertividade na tradição de GoogleTest para C++.
- proptest: Testes baseados em propriedades para Rust.
- rstest: Suporte para testes parametrizados e acessĂłrios.
Rust Inseguro (unsafe)
A linguagem Rust tem duas partes:
- Rust Seguro (Safe): memĂłria segura, nenhum comportamento indefinido Ă© possĂvel.
- Rust Inseguro (Unsafe): pode desencadear comportamento indefinido se pré-condiçÔes forem violadas.
Veremos principalmente Rust seguro neste curso, mas Ă© importante saber o que Ă© Rust inseguro (unsafe).
Código inseguro é geralmente pequeno e isolado, e seu funcionamento correto deve ser cuidadosamente documentado. Geralmente é envolto em uma camada de abstração segura.
O cĂłdigo inseguro do Rust oferece acesso a cinco novos recursos:
- Desreferenciar ponteiros brutos.
- Acessar ou modificar variĂĄveis estĂĄticas mutĂĄveis.
- Acessar os campos de uma
union
. - Chamar funçÔes inseguras (
unsafe
), incluindo funçÔesextern
(externas). - Implementar traits inseguros (
unsafe
traits).
A seguir, abordaremos brevemente os recursos inseguros. Para detalhes completos, consulte o CapĂtulo 19.1 no Rust Book e o Rustonomicon.
Rust inseguro não significa que o código esteja incorreto. Significa que os desenvolvedores desligaram os recursos de segurança do compilador e precisam escrever o código corretamente por eles mesmos. Significa também que o compilador não impÔe mais as regras de segurança de memória do Rust.
Desreferenciando Ponteiros Brutos
Criar ponteiros Ă© seguro, mas desreferenciĂĄ-los requer unsafe
:
fn main() { let mut num = 5; let r1 = &mut num as *mut i32; let r2 = r1 as *const i32; // Seguro porque r1 e r2 foram obtidos atravĂ©s de referĂȘncias e logo Ă© // garantido que eles nĂŁo sejam nulos e sejam propriamente alinhados, os objetos // cujas referĂȘncias foram obtidas sĂŁo vĂĄlidos por // todo o bloco inseguro, e eles nĂŁo sejam acessados tanto atravĂ©s das // referĂȘncias ou concorrentemente atravĂ©s de outros ponteiros. unsafe { println!("r1 Ă©: {}", *r1); *r1 = 10; println!("r2 Ă©: {}", *r2); } }
Ă uma boa prĂĄtica (e exigida pelo guia de estilo do Android Rust) escrever um comentĂĄrio para cada bloco unsafe
explicando como o código dentro dele satisfaz os requisitos de segurança para a operação insegura que estå fazendo.
No caso de desreferĂȘncia de ponteiros, isso significa que os ponteiros devem ser vĂĄlidos, ou seja:
- O ponteiro deve ser nĂŁo nulo.
- O ponteiro deve ser desreferenciĂĄvel (dentro dos limites de um Ășnico objeto alocado).
- O objeto nĂŁo deve ter sido desalocado.
- Não deve haver acessos simultùneos à mesma localização.
- Se o ponteiro foi obtido lançando uma referĂȘncia, o objeto subjacente deve estar vĂĄlido e nenhuma referĂȘncia pode ser usada para acessar a memĂłria.
Na maioria dos casos, o ponteiro também deve estar alinhado corretamente.
VariĂĄveis EstĂĄticas MutĂĄveis
Ă seguro ler uma variĂĄvel estĂĄtica imutĂĄvel:
static HELLO_WORLD: &str = "OlĂĄ, mundo!"; fn main() { println!("HELLO_WORLD: {HELLO_WORLD}"); }
No entanto, como podem ocorrer corridas de dados, nĂŁo Ă© seguro ler e gravar dados em variĂĄveis estĂĄticas mutĂĄveis:
static mut COUNTER: u32 = 0; fn add_to_counter(inc: u32) { unsafe { COUNTER += inc; } // Corrida de dados potencial! } fn main() { add_to_counter(42); unsafe { println!("COUNTER: {COUNTER}"); } // Corrida de dados potencial! }
Usar uma variĂĄvel estĂĄtica mutĂĄvel geralmente Ă© uma mĂĄ ideia, mas hĂĄ alguns casos em que isso pode fazer sentido, tais como em cĂłdigo no_std
de baixo nĂvel, como implementar um alocador de heap ou trabalhar com algumas APIs C.
UniÔes
Unions sĂŁo como enums, mas vocĂȘ mesmo precisa rastrear o campo ativo:
#[repr(C)] union MyUnion { i: u8, b: bool, } fn main() { let u = MyUnion { i: 42 }; println!("int: {}", unsafe { u.i }); println!("bool: {}", unsafe { u.b }); // Comportamento indefinido! }
Unions raramente sĂŁo necessĂĄrias no Rust, pois geralmente vocĂȘ pode usar um enum. Elas sĂŁo ocasionalmente necessĂĄrias para interagir com as APIs da biblioteca C.
Se vocĂȘ deseja apenas reinterpretar os bytes como um tipo diferente, vocĂȘ provavelmente deveria usar std::mem::transmute
ou um wrapper seguro como o crate zerocopy
.
Chamando FunçÔes Inseguras
Uma função ou método pode ser marcado como unsafe
se houver prĂ©-condiçÔes extras que vocĂȘ deve respeitar para evitar comportamento indefinido:
fn main() { let emojis = "đ»âđ"; // Seguro porque os Ăndices estĂŁo na ordem correta, dentro dos limites da // slice da string, e contido dentro da sequĂȘncia UTF-8. unsafe { println!("emoji: {}", emojis.get_unchecked(0..4)); println!("emoji: {}", emojis.get_unchecked(4..7)); println!("emoji: {}", emojis.get_unchecked(7..11)); } println!("contador de caracteres: {}", count_chars(unsafe { emojis.get_unchecked(0..7) })); // NĂŁo manter o requerimento de codificação UTF-8 viola segurança de memĂłria! // println!("emoji: {}", unsafe { emojis.get_unchecked(0..3) }); // println!("contador caracter: {}", contador_caracteres(unsafe { emojis.get_unchecked(0..3) })); } fn count_chars(s: &str) -> usize { s.chars().map(|_| 1).sum() }
Escrevendo FunçÔes Inseguras
VocĂȘ pode marcar suas prĂłprias funçÔes como inseguras (unsafe
) se elas exigirem condiçÔes especĂficas para evitar comportamentos indefinidos.
/// Troca os valores apontadoes pelos ponteiros fornecidos. /// /// # Segurança /// /// Os ponteiros precisam ser vålidos e corretamente alinhados. unsafe fn swap(a: *mut u8, b: *mut u8) { let temp = *a; *a = *b; *b = temp; } fn main() { let mut a = 42; let mut b = 66; // Seguro porque ... unsafe { swap(&mut a, &mut b); } println!("a = {}, b = {}", a, b); }
Na verdade, nĂŁo usarĂamos ponteiros para essa operação porque isso pode ser feito com segurança usando referĂȘncias.
Observe que o código inseguro é permitido dentro de uma função insegura sem o uso de um bloco unsafe
. Podemos proibir isso com #[deny(unsafe_op_in_unsafe_fn)]
. Tente adicionĂĄ-lo e veja o que acontece.
Chamando CĂłdigo Externo
FunçÔes de outras linguagens podem violar as garantias do Rust. Logo, chamå-las é inseguro:
extern "C" { fn abs(input: i32) -> i32; } fn main() { unsafe { // Comportamento indefinido se abs se comportar mal. println!("Valor absoluto de -3 de acordo com C: {}", abs(-3)); } }
Normalmente isso é apenas um problema para funçÔes externas que fazem coisas com ponteiros que podem violar o modelo de memória do Rust, mas em geral qualquer função C pode ter comportamento indefinido sob quaisquer circunstùncias arbitrårias.
O "C"
neste exemplo Ă© o ABI; outros ABIs tambĂ©m estĂŁo disponĂveis.
Implementando Traits Inseguros
Assim como nas funçÔes, vocĂȘ pode marcar um trait
como unsafe
se a implementação precisa garantir condiçÔes particulares para evitar comportamento indefinido.
Por exemplo, o crate zerocopy
tem um trait inseguro que parece algo assim:
use std::mem::size_of_val; use std::slice; /// ... /// # Segurança /// O tipo precisa ter uma representação definida e nenhum preenchimento. pub unsafe trait AsBytes { fn as_bytes(&self) -> &[u8] { unsafe { slice::from_raw_parts(self as *const Self as *const u8, size_of_val(self)) } } } // Seguro porque u32 possui uma representação definida e sem preenchimento. unsafe impl AsBytes for u32 {}
Deve haver uma seção # Safety
no Rustdoc para o trait
explicando os requisitos para ser implementado com segurança.
Na verdade, a seção de segurança para AsBytes
Ă© bem mais longa e complicada.
Os traits integrados Send
e Sync
sĂŁo inseguros.
Dia 3: ExercĂcios da Tarde
Vamos construir um wrapper seguro para ler o conteĂșdo do diretĂłrio!
Para este exercĂcio, nĂłs sugerimos a utilizaçao de um ambiente de desenvolvimento local ao invĂ©s do Playground. Isto lhe permitirĂĄ executar o binĂĄrio na sua prĂłpria mĂĄquina.
Para começar, siga as instruçoes para rodar localmente.
Depois de ver o exercĂcio, vocĂȘ pode ver a solução fornecida.
Wrapper FFI seguro
Rust tem ótimo suporte para chamar funçÔes por meio de uma interface para funçÔes externas (Function Foreign Interface - FFI). Usaremos isso para construir um wrapper (invólucro) seguro para as funçÔes da libc
de C que vocĂȘ usaria para ler os nomes dos arquivos de um diretĂłrio.
VocĂȘ vai querer consultar as pĂĄginas do manual:
VocĂȘ tambĂ©m vai querer navegar pelo mĂłdulo std::ffi
. LĂĄ vocĂȘ encontrarĂĄ um nĂșmero de tipos de string que vocĂȘ precisarĂĄ para o exercĂcio:
Tipos | Codificação | Uso |
---|---|---|
str e String | UTF-8 | Processamento de texto em Rust |
CStr e CString | terminado em NUL | Comunicação com funçÔes em C |
OsStr e OsString | especĂfico ao SO | Comunicação com o SO |
VocĂȘ irĂĄ converter entre todos estes tipos:
&str
paraCString
: vocĂȘ precisa alocar espaço para o caracter terminador\0
,CString
para*const i8
: vocĂȘ precisa de um ponteiro para chamar funçÔes em C,*const i8
para&CStr
: vocĂȘ vocĂȘ precisa de algo que pode encontrar o caracter terminador\0
,&CStr
para&[u8]
: um slice de bytes Ă© a interface universal para âalgum dado desconhecidoâ,&[u8]
para&OsStr
:&OsStr
é um passo em direção aOsString
, useOsStrExt
para criĂĄ-lo,&OsStr
paraOsString
: vocĂȘ precisa clonar os dados em&OsStr
para poder retornĂĄ-lo e chamarreaddir
novamente.
O Nomicon tambĂ©m tem um capĂtulo bastante Ăștil sobre FFI.
Copie o código abaixo para https://play.rust-lang.org/ e implemente as funçÔes e métodos que faltam:
// TODO: remova isto quando vocĂȘ terminar sua implementação . #![allow(unused_imports, unused_variables, dead_code)] mod ffi { use std::os::raw::{c_char, c_int}; #[cfg(not(target_os = "macos"))] use std::os::raw::{c_long, c_ulong, c_ushort, c_uchar}; // Tipo opaco. Veja https://doc.rust-lang.org/nomicon/ffi.html. #[repr(C)] pub struct DIR { _data: [u8; 0], _marker: core::marker::PhantomData<(*mut u8, core::marker::PhantomPinned)>, } // Layout de acordo com a pĂĄgina man do Linux para readdir(3), onde ino_t e // off_t sĂŁo resolvidos de acordo com as definiçÔes em // /usr/include/x86_64-linux-gnu/{sys/types.h, bits/typesizes.h}. #[cfg(not(target_os = "macos"))] #[repr(C)] pub struct dirent { pub d_ino: c_ulong, pub d_off: c_long, pub d_reclen: c_ushort, pub d_type: c_uchar, pub d_name: [c_char; 256], } // Layout de acordo com a pĂĄgina man do macOS man page para dir(5). #[cfg(all(target_os = "macos"))] #[repr(C)] pub struct dirent { pub d_fileno: u64, pub d_seekoff: u64, pub d_reclen: u16, pub d_namlen: u16, pub d_type: u8, pub d_name: [c_char; 1024], } extern "C" { pub fn opendir(s: *const c_char) -> *mut DIR; #[cfg(not(all(target_os = "macos", target_arch = "x86_64")))] pub fn readdir(s: *mut DIR) -> *const dirent; // Veja https://github.com/rust-lang/libc/issues/414 e a seção sobre // _DARWIN_FEATURE_64_BIT_INODE na pĂĄgina man do macOS para stat(2). // // "Plataformas que existiram antes destas atualizaçÔes estarem disponĂveis" refere-se // ao macOS (ao contrĂĄrio do iOS / wearOS / etc.) em Intel e PowerPC. #[cfg(all(target_os = "macos", target_arch = "x86_64"))] #[link_name = "readdir$INODE64"] pub fn readdir(s: *mut DIR) -> *const dirent; pub fn closedir(s: *mut DIR) -> c_int; } } use std::ffi::{CStr, CString, OsStr, OsString}; use std::os::unix::ffi::OsStrExt; #[derive(Debug)] struct DirectoryIterator { path: CString, dir: *mut ffi::DIR, } impl DirectoryIterator { fn new(path: &str) -> Result<DirectoryIterator, String> { // Chama opendir e retorna um valor Ok se funcionar, // ou retorna Err com uma mensagem. unimplemented!() } } impl Iterator for DirectoryIterator { type Item = OsString; fn next(&mut self) -> Option<OsString> { // Continua chamando readdir atĂ© nĂłs obtermos um ponteiro NULL de volta. unimplemented!() } } impl Drop for DirectoryIterator { fn drop(&mut self) { // Chama closedir se necessĂĄrio. unimplemented!() } } fn main() -> Result<(), String> { let iter = DirectoryIterator::new(".")?; println!("files: {:#?}", iter.collect::<Vec<_>>()); Ok(()) }
Bem-vindo ao Rust para Android
Rust tem suporte para desenvolvimento de plataforma nativa no Android. Isso significa que vocĂȘ pode escrever novos serviços de sistema operacional em Rust, bem como estender serviços existentes.
Hoje tentaremos chamar Rust a partir de um de seus prĂłprios projetos. EntĂŁo tente encontrar um cantinho da sua base de cĂłdigo onde podemos mover algumas linhas de cĂłdigo para o Rust. Quanto menos dependĂȘncias e tipos âexĂłticosâ, melhor. Algo que analise alguns bytes brutos seria o ideal.
Configurar
Iremos usar o um dispositivo virtual Android para testar nosso cĂłdigo. Assegure-se de ter acesso a um ou crie um novo com:
source build/envsetup.sh
lunch aosp_cf_x86_64_phone-userdebug
acloud create
Consulte o Codelab para Desenvolvedor Android para maiores detalhes.
Regras de Construção (Build)
O sistema de compilação do Android (Soong) oferece suporte ao Rust por meio de vårios módulos:
Tipo de módulo | Descrição |
---|---|
rust_binary | Produz um binĂĄrio Rust. |
rust_library | Produz uma biblioteca Rust e fornece as variantes rlib e dylib . |
rust_ffi | Produz uma biblioteca Rust C utilizĂĄvel por mĂłdulos cc e fornece variantes estĂĄticas e compartilhadas. |
rust_proc_macro | Produz uma biblioteca Rust proc-macro . Estes sĂŁo anĂĄlogos aos plugins do compilador. |
rust_test | Produz um binĂĄrio de teste Rust que usa a funcionalidade padrĂŁo de teste do Rust. |
rust_fuzz | Produz um binĂĄrio Rust fuzz aproveitando libfuzzer . |
rust_protobuf | Gera o cĂłdigo-fonte e produz uma biblioteca Rust que fornece uma interface para um protobuf especĂfico. |
rust_bindgen | Gera fonte e produz uma biblioteca Rust contendo vĂnculos em Rust para bibliotecas C. |
Veremos rust_binary
e rust_library
a seguir.
BinĂĄrios do Rust
Vamos começar com um aplicativo simples. Na raiz de um checkout AOSP, crie os seguintes arquivos:
hello_rust/Android.bp:
rust_binary {
name: "hello_rust",
crate_name: "hello_rust",
srcs: ["src/main.rs"],
}
hello_rust/src/main.rs:
//! Rust demo. /// Imprime uma saudação na saĂda padrĂŁo. fn main() { println!("OlĂĄ do Rust!"); }
Agora vocĂȘ pode compilar, enviar e executar o binĂĄrio:
m hello_rust
adb push "$ANDROID_PRODUCT_OUT/system/bin/hello_rust /data/local/tmp"
adb shell /data/local/tmp/hello_rust
Hello from Rust!
Bibliotecas de Rust
VocĂȘ usa rust_library
para criar uma nova biblioteca Rust para Android.
Aqui declaramos uma dependĂȘncia em duas bibliotecas:
libgreeting
, que definimos abaixo,libtextwrap
, que Ă© umcrate
jĂĄ oferecido emexternal/rust/crates/
.
hello_rust/Android.bp:
rust_binary {
name: "hello_rust_with_dep",
crate_name: "hello_rust_with_dep",
srcs: ["src/main.rs"],
rustlibs: [
"libgreetings",
"libtextwrap",
],
prefer_rlib: true,
}
rust_library {
name: "libgreetings",
crate_name: "greetings",
srcs: ["src/lib.rs"],
}
hello_rust/src/main.rs:
//! Rust demo.
use greetings::greeting;
use textwrap::fill;
/// Imprime uma saudação na saĂda padrĂŁo.
fn main() {
println!("{}", fill(&greeting("Bob"), 24));
}
hello_rust/src/lib.rs:
//! Greeting library.
/// Saudação `nome`.
pub fn greeting(name: &str) -> String {
format!("OlĂĄ {nome}, prazer em conhecĂȘ-lo!")
}
VocĂȘ constrĂłi, envia e executa o binĂĄrio como antes:
m hello_rust_with_dep
adb push "$ANDROID_PRODUCT_OUT/system/bin/hello_rust_with_dep /data/local/tmp"
adb shell /data/local/tmp/hello_rust_with_dep
Hello Bob, it is very
nice to meet you!
AIDL
A Linguagem de Definição de Interface Android (AIDL) Ă© compatĂvel com Rust:
- O cĂłdigo Rust pode chamar servidores AIDL existentes,
- VocĂȘ pode criar novos servidores AIDL em Rust.
Interfaces AIDL
VocĂȘ declara a API do seu serviço usando uma interface AIDL:
birthday_service/aidl/com/example/birthdayservice/IBirthdayService.aidl:
package com.example.birthdayservice;
/** Interface de serviço de aniversårio. */
interface IBirthdayService {
/** Gera uma mensagem de feliz aniversĂĄrio. */
String wishHappyBirthday(String name, int years);
}
birthday_service/aidl/Android.bp:
aidl_interface {
name: "com.example.birthdayservice",
srcs: ["com/example/birthdayservice/*.aidl"],
unstable: true,
backend: {
rust: { // Rust nĂŁo estĂĄ ativado por padrĂŁo
enabled: true,
},
},
}
Adicione vendor_available: true
caso seu arquivo AIDL seja usado por um binårio na partição vendor.
Implementação do Serviço
Agora podemos implementar o serviço AIDL:
birthday_service/src/lib.rs:
//! Implementation of the `IBirthdayService` AIDL interface.
use com_example_birthdayservice::aidl::com::example::birthdayservice::IBirthdayService::IBirthdayService;
use com_example_birthdayservice::binder;
/// A implementação de `IBirthdayService`.
pub struct BirthdayService;
impl binder::Interface for BirthdayService {}
impl IBirthdayService for BirthdayService {
fn wishHappyBirthday(&self, name: &str, years: i32) -> binder::Result<String> {
Ok(format!(
"Feliz aniversårio {name}, parabéns pelos seus {years} anos!"
))
}
}
birthday_service/Android.bp:
rust_library {
name: "libbirthdayservice",
srcs: ["src/lib.rs"],
crate_name: "birthdayservice",
rustlibs: [
"com.example.birthdayservice-rust",
"libbinder_rs",
],
}
Servidor AIDL
Finalmente, podemos criar um servidor que expÔe o serviço:
birthday_service/src/server.rs:
//! Birthday service.
use birthdayservice::BirthdayService;
use com_example_birthdayservice::aidl::com::example::birthdayservice::IBirthdayService::BnBirthdayService;
use com_example_birthdayservice::binder;
const SERVICE_IDENTIFIER: &str = "birthdayservice";
/// Ponto de entrada para serviço de aniversårio.
fn main() {
let birthday_service = BirthdayService;
let birthday_service_binder = BnBirthdayService::new_binder(
birthday_service,
binder::BinderFeatures::default(),
);
binder::add_service(SERVICE_IDENTIFIER, birthday_service_binder.as_binder())
.expect("Falha ao registrar o serviço");
binder::ProcessState::join_thread_pool()
}
birthday_service/Android.bp:
rust_binary {
name: "birthday_server",
crate_name: "birthday_server",
srcs: ["src/server.rs"],
rustlibs: [
"com.example.birthdayservice-rust",
"libbinder_rs",
"libbirthdayservice",
],
prefer_rlib: true,
}
Implantar
Agora podemos compilar, enviar e iniciar o serviço:
m birthday_server
adb push "$ANDROID_PRODUCT_OUT/system/bin/birthday_server /data/local/tmp"
adb shell /data/local/tmp/birthday_server
Em outro terminal, verifique se o serviço estå sendo executado:
adb shell service check birthdayservice
Service birthdayservice: found
VocĂȘ tambĂ©m pode chamar o serviço com service call
:
adb shell service call birthdayservice 1 s16 Bob i32 24
Result: Parcel(
0x00000000: 00000000 00000036 00610048 00700070 '....6...H.a.p.p.'
0x00000010: 00200079 00690042 00740072 00640068 'y. .B.i.r.t.h.d.'
0x00000020: 00790061 00420020 0062006f 0020002c 'a.y. .B.o.b.,. .'
0x00000030: 006f0063 0067006e 00610072 00750074 'c.o.n.g.r.a.t.u.'
0x00000040: 0061006c 00690074 006e006f 00200073 'l.a.t.i.o.n.s. .'
0x00000050: 00690077 00680074 00740020 00650068 'w.i.t.h. .t.h.e.'
0x00000060: 00320020 00200034 00650079 00720061 ' .2.4. .y.e.a.r.'
0x00000070: 00210073 00000000 's.!..... ')
Cliente AIDL
Por fim, podemos criar um cliente Rust para nosso novo serviço.
birthday_server/src/client.rs:
//! Birthday service.
use com_example_birthdayservice::aidl::com::example::birthdayservice::IBirthdayService::IBirthdayService;
use com_example_birthdayservice::binder;
const SERVICE_IDENTIFIER: &str = "birthdayservice";
/// Connecta-se ao serviço de aniversårio BirthdayService.
pub fn connect() -> Result<binder::Strong<dyn IBirthdayService>, binder::StatusCode> {
binder::get_interface(SERVICE_IDENTIFIER)
}
/// Chama o serviço de aniversårio.
fn main() -> Result<(), binder::Status> {
let name = std::env::args()
.nth(1)
.unwrap_or_else(|| String::from("Bob"));
let years = std::env::args()
.nth(2)
.and_then(|arg| arg.parse::<i32>().ok())
.unwrap_or(42);
binder::ProcessState::start_thread_pool();
let service = connect().expect("Falha ao conectar-se a BirthdayService");
let msg = service.wishHappyBirthday(&name, years)?;
println!("{msg}");
Ok(())
}
birthday_service/Android.bp:
rust_binary {
name: "birthday_client",
crate_name: "birthday_client",
srcs: ["src/client.rs"],
rustlibs: [
"com.example.birthdayservice-rust",
"libbinder_rs",
],
prefer_rlib: true,
}
Observe que o cliente nĂŁo depende de libbirthdayservice
.
Compile, envie e execute o cliente em seu dispositivo:
m birthday_client
adb push "$ANDROID_PRODUCT_OUT/system/bin/birthday_client /data/local/tmp"
adb shell /data/local/tmp/birthday_client Carlos 60
Happy Birthday Charlie, congratulations with the 60 years!
Alterando API
Vamos estender a API com mais funcionalidades: queremos permitir que os clientes especifiquem uma lista de frases para o cartĂŁo de aniversĂĄrio:
package com.example.birthdayservice;
/** Interface de serviço de aniversårio. */
interface IBirthdayService {
/** Gera uma mensagem de feliz aniversĂĄrio. */
String wishHappyBirthday(String name, int years, in String[] text);
}
Gerando Registros (Log)
VocĂȘ deve usar o crate
log
para logar automaticamente no logcat
(no dispositivo) ou stdout
(no host):
hello_rust_logs/Android.bp:
rust_binary {
name: "hello_rust_logs",
crate_name: "hello_rust_logs",
srcs: ["src/main.rs"],
rustlibs: [
"liblog_rust",
"liblogger",
],
prefer_rlib: true,
host_supported: true,
}
hello_rust_logs/src/main.rs:
//! Rust logging demo.
use log::{debug, error, info};
/// Registra uma saudação.
fn main() {
logger::init(
logger::Config::default()
.with_tag_on_device("rust")
.with_min_level(log::Level::Trace),
);
debug!("Iniciando programa.");
info!("As coisas estĂŁo indo bem.");
error!("Algo deu errado!");
}
Compile, envie e execute o binĂĄrio em seu dispositivo:
m hello_rust_logs
adb push "$ANDROID_PRODUCT_OUT/system/bin/hello_rust_logs /data/local/tmp"
adb shell /data/local/tmp/hello_rust_logs
Os logs aparecem em adb logcat
:
adb logcat -s rust
09-08 08:38:32.454 2420 2420 D rust: hello_rust_logs: Starting program.
09-08 08:38:32.454 2420 2420 I rust: hello_rust_logs: Things are going fine.
09-08 08:38:32.454 2420 2420 E rust: hello_rust_logs: Something went wrong!
Interoperabilidade
O Rust tem excelente suporte para interoperabilidade com outras linguagens. Isso significa que vocĂȘ pode:
- Chamar funçÔes Rust em outras linguagens.
- Chamar funçÔes escritas em outras linguagens no Rust.
Quando vocĂȘ chama funçÔes em outra linguagem, dizemos que vocĂȘ estĂĄ usando uma interface de função externa, tambĂ©m conhecida como FFI.
Interoperabilidade com C
Rust tem suporte completo para vincular arquivos de objeto com uma convenção de chamada C. Da mesma forma, vocĂȘ pode exportar funçÔes Rust e chamĂĄ-las em C.
VocĂȘ pode fazer isso manualmente se quiser:
extern "C" { fn abs(x: i32) -> i32; } fn main() { let x = -42; let abs_x = unsafe { abs(x) }; println!("{x}, {abs_x}"); }
JĂĄ vimos isso no exercĂcio Safe FFI Wrapper .
Isso pressupÔe conhecimento total da plataforma de destino. Não recomendado para produção.
Veremos opçÔes melhores a seguir.
Usando Bindgen
A ferramenta bindgen pode gerar vĂnculos (bindings) automaticamente a partir de um arquivo de cabeçalho C.
Primeiro crie uma pequena biblioteca C:
interoperability/bindgen/libbirthday.h:
typedef struct card {
const char* name;
int years;
} card;
void print_card(const card* card);
interoperability/bindgen/libbirthday.c:
#include <stdio.h>
#include "libbirthday.h"
void print_card(const card* card) {
printf("+--------------\n");
printf("|Feliz AniversĂĄrio %s!\n", card->name);
printf("|Parabéns pelos %i anos!\n", card->years);
printf("+--------------\n");
}
Adicione isto ao seu arquivo Android.bp
:
interoperability/bindgen/Android.bp:
cc_library {
name: "libbirthday",
srcs: ["libbirthday.c"],
}
Crie um arquivo de cabeçalho wrapper para a biblioteca (não estritamente necessårio neste exemplo):
interoperability/bindgen/libbirthday_wrapper.h:
#include "libbirthday.h"
Agora vocĂȘ pode gerar automaticamente as vinculaçÔes (binding):
interoperability/bindgen/Android.bp:
rust_bindgen {
name: "libbirthday_bindgen",
crate_name: "birthday_bindgen",
wrapper_src: "libbirthday_wrapper.h",
source_stem: "bindings",
static_libs: ["libbirthday"],
}
Finalmente, podemos usar as vinculaçÔes (bindings) em nosso programa Rust:
interoperability/bindgen/Android.bp:
rust_binary {
name: "print_birthday_card",
srcs: ["main.rs"],
rustlibs: ["libbirthday_bindgen"],
}
interoperability/bindgen/main.rs:
//! Bindgen demo. use birthday_bindgen::{card, print_card}; fn main() { let name = std::ffi::CString::new("Pedro").unwrap(); let card = card { name: name.as_ptr(), years: 42, }; unsafe { print_card(&card as *const card); } }
Compile, envie e execute o binĂĄrio em seu dispositivo:
m print_birthday_card
adb push "$ANDROID_PRODUCT_OUT/system/bin/print_birthday_card /data/local/tmp"
adb shell /data/local/tmp/print_birthday_card
Por fim, podemos executar testes gerados automaticamente para garantir que as vinculaçÔes funcionem:
interoperability/bindgen/Android.bp:
rust_test {
name: "libbirthday_bindgen_test",
srcs: [":libbirthday_bindgen"],
crate_name: "libbirthday_bindgen_test",
test_suites: ["general-tests"],
auto_gen_config: true,
clippy_lints: "none", // Arquivo gerado, pule o linting
lints: "none",
}
atest libbirthday_bindgen_test
Chamando Rust
Exportar funçÔes e tipos do Rust para C é fåcil:
interoperability/rust/libanalyze/analyze.rs
//! Rust FFI demo. #![deny(improper_ctypes_definitions)] use std::os::raw::c_int; /// Analisar os nĂșmeros. #[no_mangle] pub extern "C" fn analyze_numbers(x: c_int, y: c_int) { if x < y { println!("x ({x}) Ă© o menor!"); } else { println!("y ({y}) Ă© provavelmente maior que x ({x})"); } }
interoperability/rust/libanalyze/analyze.h
#ifndef ANALYSE_H
#define ANALYSE_H
extern "C" {
void analyze_numbers(int x, int y);
}
#endif
interoperability/rust/libanalyze/Android.bp
rust_ffi {
name: "libanalyze_ffi",
crate_name: "analyze_ffi",
srcs: ["analyze.rs"],
include_dirs: ["."],
}
Agora podemos chamĂĄ-lo a partir de um binĂĄrio C:
interoperability/rust/analisar/main.c
#include "analyze.h"
int main() {
analyze_numbers(10, 20);
analyze_numbers(123, 123);
return 0;
}
interoperability/rust/analyze/Android.bp
cc_binary {
name: "analyze_numbers",
srcs: ["main.c"],
static_libs: ["libanalyze_ffi"],
}
Compile, envie e execute o binĂĄrio em seu dispositivo:
m analyze_numbers
adb push "$ANDROID_PRODUCT_OUT/system/bin/analyze_numbers /data/local/tmp"
adb shell /data/local/tmp/analyze_numbers
#[no_mangle]
desativa a alteração de name usual do Rust, entĂŁo o sĂmbolo exportado serĂĄ apenas o nome da função. VocĂȘ tambĂ©m pode usar #[export_name = "some_name"]
para especificar qualquer nome que desejar.
Com C++
O crate CXX possibilita a interoperabilidade segura entre Rust e C++.
A abordagem geral Ă© assim:
Veja o tutorial CXX para um exemplo completo de como usĂĄ-lo.
-
At this point, the instructor should switch to the CXX tutorial.
-
Walk the students through the tutorial step by step.
-
Highlight how CXX presents a clean interface without unsafe code in both languages.
-
Show the correspondence between Rust and C++ types:
-
Explain how a Rust
String
cannot map to a C++std::string
(the latter does not uphold the UTF-8 invariant). Show that despite being different types,rust::String
in C++ can be easily constructed from a C++std::string
, making it very ergonomic to use. -
Explain that a Rust function returning
Result<T, E>
becomes a function which throws aE
exception in C++ (and vice versa).
-
Interoperabilidade com Java
Java pode carregar objetos compartilhados via Java Native Interface (JNI). O crate jni
permite que vocĂȘ crie uma biblioteca compatĂvel.
Primeiro, criamos uma função Rust para exportar para Java:
interoperability/java/src/lib.rs:
#![allow(unused)] fn main() { //! Rust <-> Java FFI demo. use jni::objects::{JClass, JString}; use jni::sys::jstring; use jni::JNIEnv; /// Implementação do método HelloWorld::hello. #[no_mangle] pub extern "system" fn Java_HelloWorld_hello( env: JNIEnv, _class: JClass, name: JString, ) -> jstring { let input: String = env.get_string(name).unwrap().into(); let greeting = format!("Olå, {input}!"); let output = env.new_string(greeting).unwrap(); output.into_inner() } }
interoperability/java/Android.bp:
rust_ffi_shared {
name: "libhello_jni",
crate_name: "hello_jni",
srcs: ["src/lib.rs"],
rustlibs: ["libjni"],
}
Finalmente, podemos chamar esta função do Java:
interoperability/java/HelloWorld.java:
class HelloWorld {
private static native String hello(String name);
static {
System.loadLibrary("hello_jni");
}
public static void main(String[] args) {
String output = HelloWorld.hello("Alice");
System.out.println(output);
}
}
interoperability/java/Android.bp:
java_binary {
name: "helloworld_jni",
srcs: ["HelloWorld.java"],
main_class: "HelloWorld",
required: ["libhello_jni"],
}
Por fim, vocĂȘ pode criar, sincronizar e executar o binĂĄrio:
m helloworld_jni
adb sync # requires adb root && adb remount
adb shell /system/bin/helloworld_jni
ExercĂcios
Este Ă© um exercĂcio em grupo: NĂłs iremos ver um dos projetos com os quais vocĂȘ trabalha e tentar integrar um pouco de Rust nele. Algumas sugestĂ”es:
-
Chame seu serviço AIDL com um cliente escrito em Rust.
-
Mova uma função do seu projeto para o Rust e a chame.
Nenhuma solução Ă© fornecida aqui, pois isso Ă© aberto: depende de vocĂȘ ter uma classe tendo um pedaço de cĂłdigo que vocĂȘ pode transformar em Rust em tempo real.
Bem-vindo ao Rust Bare Metal đŠ
This is a standalone one-day course about bare-metal Rust, aimed at people who are familiar with the basics of Rust (perhaps from completing the Comprehensive Rust course), and ideally also have some experience with bare-metal programming in some other language such as C.
Today we will talk about âbare-metalâ Rust: running Rust code without an OS underneath us. This will be divided into several parts:
- What is
no_std
Rust? - Writing firmware for microcontrollers.
- Writing bootloader / kernel code for application processors.
- Some useful crates for bare-metal Rust development.
For the microcontroller part of the course we will use the BBC micro:bit v2 as an example. Itâs a development board based on the Nordic nRF51822 microcontroller with some LEDs and buttons, an I2C-connected accelerometer and compass, and an on-board SWD debugger.
To get started, install some tools weâll need later. On gLinux or Debian:
sudo apt install gcc-aarch64-linux-gnu gdb-multiarch libudev-dev picocom pkg-config qemu-system-arm
rustup update
rustup target add aarch64-unknown-none thumbv7em-none-eabihf
rustup component add llvm-tools-preview
cargo install cargo-binutils cargo-embed
And give users in the plugdev
group access to the micro:bit programmer:
echo 'SUBSYSTEM=="usb", ATTR{idVendor}=="0d28", MODE="0664", GROUP="plugdev"' |\
sudo tee /etc/udev/rules.d/50-microbit.rules
sudo udevadm control --reload-rules
On MacOS:
xcode-select --install
brew install gdb picocom qemu
brew install --cask gcc-aarch64-embedded
rustup update
rustup target add aarch64-unknown-none thumbv7em-none-eabihf
rustup component add llvm-tools-preview
cargo install cargo-binutils cargo-embed
no_std
|
|
|
---|---|---|
|
|
|
HashMap
depends on RNG.std
re-exports the contents of bothcore
andalloc
.
A minimal no_std
program
#![no_main] #![no_std] use core::panic::PanicInfo; #[panic_handler] fn panic(_panic: &PanicInfo) -> ! { loop {} }
- This will compile to an empty binary.
std
provides a panic handler; without it we must provide our own.- It can also be provided by another crate, such as
panic-halt
. - Depending on the target, you may need to compile with
panic = "abort"
to avoid an error abouteh_personality
. - Note that there is no
main
or any other entry point; itâs up to you to define your own entry point. This will typically involve a linker script and some assembly code to set things up ready for Rust code to run.
alloc
To use alloc
you must implement a global (heap) allocator.
#![no_main] #![no_std] extern crate alloc; extern crate panic_halt as _; use alloc::string::ToString; use alloc::vec::Vec; use buddy_system_allocator::LockedHeap; #[global_allocator] static HEAP_ALLOCATOR: LockedHeap<32> = LockedHeap::<32>::new(); static mut HEAP: [u8; 65536] = [0; 65536]; pub fn entry() { // Safe because `HEAP` is only used here and `entry` is only called once. unsafe { // Give the allocator some memory to allocate. HEAP_ALLOCATOR .lock() .init(HEAP.as_mut_ptr() as usize, HEAP.len()); } // Now we can do things that require heap allocation. let mut v = Vec::new(); v.push("A string".to_string()); }
buddy_system_allocator
is a third-party crate implementing a basic buddy system allocator. Other crates are available, or you can write your own or hook into your existing allocator.- The const parameter of
LockedHeap
is the max order of the allocator; i.e. in this case it can allocate regions of up to 2**32 bytes. - If any crate in your dependency tree depends on
alloc
then you must have exactly one global allocator defined in your binary. Usually this is done in the top-level binary crate. extern crate panic_halt as _
is necessary to ensure that thepanic_halt
crate is linked in so we get its panic handler.- This example will build but not run, as it doesnât have an entry point.
Microcontrollers
The cortex_m_rt
crate provides (among other things) a reset handler for Cortex M microcontrollers.
#![no_main] #![no_std] extern crate panic_halt as _; mod interrupts; use cortex_m_rt::entry; #[entry] fn main() -> ! { loop {} }
Next weâll look at how to access peripherals, with increasing levels of abstraction.
- The
cortex_m_rt::entry
macro requires that the function have typefn() -> !
, because returning to the reset handler doesnât make sense. - Run the example with
cargo embed --bin minimal
Raw MMIO
Most microcontrollers access peripherals via memory-mapped IO. Letâs try turning on an LED on our micro:bit:
#![no_main] #![no_std] extern crate panic_halt as _; mod interrupts; use core::mem::size_of; use cortex_m_rt::entry; /// GPIO port 0 peripheral address const GPIO_P0: usize = 0x5000_0000; // GPIO peripheral offsets const PIN_CNF: usize = 0x700; const OUTSET: usize = 0x508; const OUTCLR: usize = 0x50c; // PIN_CNF fields const DIR_OUTPUT: u32 = 0x1; const INPUT_DISCONNECT: u32 = 0x1 << 1; const PULL_DISABLED: u32 = 0x0 << 2; const DRIVE_S0S1: u32 = 0x0 << 8; const SENSE_DISABLED: u32 = 0x0 << 16; #[entry] fn main() -> ! { // Configure GPIO 0 pins 21 and 28 as push-pull outputs. let pin_cnf_21 = (GPIO_P0 + PIN_CNF + 21 * size_of::<u32>()) as *mut u32; let pin_cnf_28 = (GPIO_P0 + PIN_CNF + 28 * size_of::<u32>()) as *mut u32; // Safe because the pointers are to valid peripheral control registers, and // no aliases exist. unsafe { pin_cnf_21.write_volatile( DIR_OUTPUT | INPUT_DISCONNECT | PULL_DISABLED | DRIVE_S0S1 | SENSE_DISABLED, ); pin_cnf_28.write_volatile( DIR_OUTPUT | INPUT_DISCONNECT | PULL_DISABLED | DRIVE_S0S1 | SENSE_DISABLED, ); } // Set pin 28 low and pin 21 high to turn the LED on. let gpio0_outset = (GPIO_P0 + OUTSET) as *mut u32; let gpio0_outclr = (GPIO_P0 + OUTCLR) as *mut u32; // Safe because the pointers are to valid peripheral control registers, and // no aliases exist. unsafe { gpio0_outclr.write_volatile(1 << 28); gpio0_outset.write_volatile(1 << 21); } loop {} }
- GPIO 0 pin 21 is connected to the first column of the LED matrix, and pin 28 to the first row.
Run the example with:
cargo embed --bin mmio
Peripheral Access Crates
svd2rust
generates mostly-safe Rust wrappers for memory-mapped peripherals from CMSIS-SVD files.
#![no_main] #![no_std] extern crate panic_halt as _; use cortex_m_rt::entry; use nrf52833_pac::Peripherals; #[entry] fn main() -> ! { let p = Peripherals::take().unwrap(); let gpio0 = p.P0; // Configure GPIO 0 pins 21 and 28 as push-pull outputs. gpio0.pin_cnf[21].write(|w| { w.dir().output(); w.input().disconnect(); w.pull().disabled(); w.drive().s0s1(); w.sense().disabled(); w }); gpio0.pin_cnf[28].write(|w| { w.dir().output(); w.input().disconnect(); w.pull().disabled(); w.drive().s0s1(); w.sense().disabled(); w }); // Set pin 28 low and pin 21 high to turn the LED on. gpio0.outclr.write(|w| w.pin28().clear()); gpio0.outset.write(|w| w.pin21().set()); loop {} }
- SVD (System View Description) files are XML files typically provided by silicon vendors which describe the memory map of the device.
- They are organised by peripheral, register, field and value, with names, descriptions, addresses and so on.
- SVD files are often buggy and incomplete, so there are various projects which patch the mistakes, add missing details, and publish the generated crates.
cortex-m-rt
provides the vector table, among other things.- If you
cargo install cargo-binutils
then you can runcargo objdump --bin pac -- -d --no-show-raw-insn
to see the resulting binary.
Run the example with:
cargo embed --bin pac
HAL crates
HAL crates for many microcontrollers provide wrappers around various peripherals. These generally implement traits from embedded-hal
.
#![no_main] #![no_std] extern crate panic_halt as _; use cortex_m_rt::entry; use nrf52833_hal::gpio::{p0, Level}; use nrf52833_hal::pac::Peripherals; use nrf52833_hal::prelude::*; #[entry] fn main() -> ! { let p = Peripherals::take().unwrap(); // Create HAL wrapper for GPIO port 0. let gpio0 = p0::Parts::new(p.P0); // Configure GPIO 0 pins 21 and 28 as push-pull outputs. let mut col1 = gpio0.p0_28.into_push_pull_output(Level::High); let mut row1 = gpio0.p0_21.into_push_pull_output(Level::Low); // Set pin 28 low and pin 21 high to turn the LED on. col1.set_low().unwrap(); row1.set_high().unwrap(); loop {} }
set_low
andset_high
are methods on theembedded_hal
OutputPin
trait.- HAL crates exist for many Cortex-M and RISC-V devices, including various STM32, GD32, nRF, NXP, MSP430, AVR and PIC microcontrollers.
Run the example with:
cargo embed --bin hal
Atalhos de teclado
Board support crates provide a further level of wrapping for a specific board for convenience.
#![no_main] #![no_std] extern crate panic_halt as _; use cortex_m_rt::entry; use microbit::hal::prelude::*; use microbit::Board; #[entry] fn main() -> ! { let mut board = Board::take().unwrap(); board.display_pins.col1.set_low().unwrap(); board.display_pins.row1.set_high().unwrap(); loop {} }
- In this case the board support crate is just providing more useful names, and a bit of initialisation.
- The crate may also include drivers for some on-board devices outside of the microcontroller itself.
microbit-v2
includes a simple driver for the LED matrix.
Run the example with:
cargo embed --bin board_support
The type state pattern
#[entry] fn main() -> ! { let p = Peripherals::take().unwrap(); let gpio0 = p0::Parts::new(p.P0); let pin: P0_01<Disconnected> = gpio0.p0_01; // let gpio0_01_again = gpio0.p0_01; // Error, moved. let pin_input: P0_01<Input<Floating>> = pin.into_floating_input(); if pin_input.is_high().unwrap() { // ⊠} let mut pin_output: P0_01<Output<OpenDrain>> = pin_input .into_open_drain_output(OpenDrainConfig::Disconnect0Standard1, Level::Low); pin_output.set_high().unwrap(); // pin_input.is_high(); // Error, moved. let _pin2: P0_02<Output<OpenDrain>> = gpio0 .p0_02 .into_open_drain_output(OpenDrainConfig::Disconnect0Standard1, Level::Low); let _pin3: P0_03<Output<PushPull>> = gpio0.p0_03.into_push_pull_output(Level::Low); loop {} }
- Pins donât implement
Copy
orClone
, so only one instance of each can exist. Once a pin is moved out of the port struct nobody else can take it. - Changing the configuration of a pin consumes the old pin instance, so you canât keep use the old instance afterwards.
- The type of a value indicates the state that it is in: e.g. in this case, the configuration state of a GPIO pin. This encodes the state machine into the type system, and ensures that you donât try to use a pin in a certain way without properly configuring it first. Illegal state transitions are caught at compile time.
- You can call
is_high
on an input pin andset_high
on an output pin, but not vice-versa. - Many HAL crates follow this pattern.
embedded-hal
The embedded-hal
crate provides a number of traits covering common microcontroller peripherals.
- GPIO
- ADC
- I2C, SPI, UART, CAN
- RNG
- Timers
- Watchdogs
Other crates then implement drivers in terms of these traits, e.g. an accelerometer driver might need an I2C or SPI bus implementation.
- There are implementations for many microcontrollers, as well as other platforms such as Linux on Raspberry Pi.
- There is work in progress on an
async
version ofembedded-hal
, but it isnât stable yet.
probe-rs
, cargo-embed
probe-rs is a handy toolset for embedded debugging, like OpenOCD but better integrated.
- SWD and JTAG via CMSIS-DAP, ST-Link and J-Link probes
- GDB stub and Microsoft DAP server
- Cargo integration
cargo-embed
is a cargo subcommand to build and flash binaries, log RTT output and connect GDB. Itâs configured by an Embed.toml
file in your project directory.
- CMSIS-DAP is an Arm standard protocol over USB for an in-circuit debugger to access the CoreSight Debug Access Port of various Arm Cortex processors. Itâs what the on-board debugger on the BBC micro:bit uses.
- ST-Link is a range of in-circuit debuggers from ST Microelectronics, J-Link is a range from SEGGER.
- The Debug Access Port is usually either a 5-pin JTAG interface or 2-pin Serial Wire Debug.
- probe-rs is a library which you can integrate into your own tools if you want to.
- The Microsoft Debug Adapter Protocol lets VSCode and other IDEs debug code running on any supported microcontroller.
- cargo-embed is a binary built using the probe-rs library.
- RTT (Real Time Transfers) is a mechanism to transfer data between the debug host and the target through a number of ringbuffers.
Debugging
Embed.toml:
[default.general]
chip = "nrf52833_xxAA"
[debug.gdb]
enabled = true
In one terminal under src/bare-metal/microcontrollers/examples/
:
cargo embed --bin board_support debug
In another terminal in the same directory:
gdb-multiarch target/thumbv7em-none-eabihf/debug/board_support --eval-command="target remote :1337"
In GDB, try running:
b src/bin/board_support.rs:29
b src/bin/board_support.rs:30
b src/bin/board_support.rs:32
c
c
c
Other projects
- RTIC
- âReal-Time Interrupt-driven Concurrencyâ
- Shared resource management, message passing, task scheduling, timer queue
- Embassy
async
executors with priorities, timers, networking, USB
- TockOS
- Security-focused RTOS with preemptive scheduling and Memory Protection Unit support
- Hubris
- Microkernel RTOS from Oxide Computer Company with memory protection, unprivileged drivers, IPC
- Bindings for FreeRTOS
- Some platforms have
std
implementations, e.g. esp-idf.
- RTIC can be considered either an RTOS or a concurrency framework.
- It doesnât include any HALs.
- It uses the Cortex-M NVIC (Nested Virtual Interrupt Controller) for scheduling rather than a proper kernel.
- Cortex-M only.
- Google uses TockOS on the Haven microcontroller for Titan security keys.
- FreeRTOS is mostly written in C, but there are Rust bindings for writing applications.
ExercĂcios
We will read the direction from an I2C compass, and log the readings to a serial port.
Depois de ver os exercĂcios, vocĂȘ pode ver as soluçÔes fornecidas.
BĂșssola
We will read the direction from an I2C compass, and log the readings to a serial port. If you have time, try displaying it on the LEDs somehow too, or use the buttons somehow.
Hints:
- Check the documentation for the
lsm303agr
andmicrobit-v2
crates, as well as the micro:bit hardware. - The LSM303AGR Inertial Measurement Unit is connected to the internal I2C bus.
- TWI is another name for I2C, so the I2C master peripheral is called TWIM.
- The LSM303AGR driver needs something implementing the
embedded_hal::blocking::i2c::WriteRead
trait. Themicrobit::hal::Twim
struct implements this. - You have a
microbit::Board
struct with fields for the various pins and peripherals. - You can also look at the nRF52833 datasheet if you want, but it shouldnât be necessary for this exercise.
Download the exercise template and look in the compass
directory for the following files.
src/main.rs
:
#![no_main] #![no_std] extern crate panic_halt as _; use core::fmt::Write; use cortex_m_rt::entry; use microbit::{hal::uarte::{Baudrate, Parity, Uarte}, Board}; #[entry] fn main() -> ! { let board = Board::take().unwrap(); // Configure serial port. let mut serial = Uarte::new( board.UARTE0, board.uart.into(), Parity::EXCLUDED, Baudrate::BAUD115200, ); // Set up the I2C controller and Inertial Measurement Unit. // TODO writeln!(serial, "Ready.").unwrap(); loop { // Read compass data and log it to the serial port. // TODO } }
Cargo.toml
(you shouldnât need to change this):
[workspace]
[package]
name = "compass"
version = "0.1.0"
edition = "2021"
publish = false
[dependencies]
cortex-m-rt = "0.7.3"
embedded-hal = "0.2.6"
lsm303agr = "0.2.2"
microbit-v2 = "0.13.0"
panic-halt = "0.2.0"
Embed.toml
(you shouldnât need to change this):
[default.general]
chip = "nrf52833_xxAA"
[debug.gdb]
enabled = true
[debug.reset]
halt_afterwards = true
.cargo/config.toml
(you shouldnât need to change this):
[build]
target = "thumbv7em-none-eabihf" # Cortex-M4F
[target.'cfg(all(target_arch = "arm", target_os = "none"))']
rustflags = ["-C", "link-arg=-Tlink.x"]
See the serial output on Linux with:
picocom --baud 115200 --imap lfcrlf /dev/ttyACM0
Or on Mac OS something like (the device name may be slightly different):
picocom --baud 115200 --imap lfcrlf /dev/tty.usbmodem14502
Use Ctrl+A Ctrl+Q to quit picocom.
Application processors
So far weâve talked about microcontrollers, such as the Arm Cortex-M series. Now letâs try writing something for Cortex-A. For simplicity weâll just work with QEMUâs aarch64 âvirtâ board.
- Broadly speaking, microcontrollers donât have an MMU or multiple levels of privilege (exception levels on Arm CPUs, rings on x86), while application processors do.
- QEMU supports emulating various different machines or board models for each architecture. The âvirtâ board doesnât correspond to any particular real hardware, but is designed purely for virtual machines.
Getting Ready to Rust
Before we can start running Rust code, we need to do some initialisation.
.section .init.entry, "ax"
.global entry
entry:
/*
* Load and apply the memory management configuration, ready to enable MMU and
* caches.
*/
adrp x30, idmap
msr ttbr0_el1, x30
mov_i x30, .Lmairval
msr mair_el1, x30
mov_i x30, .Ltcrval
/* Copy the supported PA range into TCR_EL1.IPS. */
mrs x29, id_aa64mmfr0_el1
bfi x30, x29, #32, #4
msr tcr_el1, x30
mov_i x30, .Lsctlrval
/*
* Ensure everything before this point has completed, then invalidate any
* potentially stale local TLB entries before they start being used.
*/
isb
tlbi vmalle1
ic iallu
dsb nsh
isb
/*
* Configure sctlr_el1 to enable MMU and cache and don't proceed until this
* has completed.
*/
msr sctlr_el1, x30
isb
/* Disable trapping floating point access in EL1. */
mrs x30, cpacr_el1
orr x30, x30, #(0x3 << 20)
msr cpacr_el1, x30
isb
/* Zero out the bss section. */
adr_l x29, bss_begin
adr_l x30, bss_end
0: cmp x29, x30
b.hs 1f
stp xzr, xzr, [x29], #16
b 0b
1: /* Prepare the stack. */
adr_l x30, boot_stack_end
mov sp, x30
/* Set up exception vector. */
adr x30, vector_table_el1
msr vbar_el1, x30
/* Call into Rust code. */
bl main
/* Loop forever waiting for interrupts. */
2: wfi
b 2b
- This is the same as it would be for C: initialising the processor state, zeroing the BSS, and setting up the stack pointer.
- The BSS (block starting symbol, for historical reasons) is the part of the object file which containing statically allocated variables which are initialised to zero. They are omitted from the image, to avoid wasting space on zeroes. The compiler assumes that the loader will take care of zeroing them.
- The BSS may already be zeroed, depending on how memory is initialised and the image is loaded, but we zero it to be sure.
- We need to enable the MMU and cache before reading or writing any memory. If we donât:
- Unaligned accesses will fault. We build the Rust code for the
aarch64-unknown-none
target which sets+strict-align
to prevent the compiler generating unaligned accesses, so it should be fine in this case, but this is not necessarily the case in general. - If it were running in a VM, this can lead to cache coherency issues. The problem is that the VM is accessing memory directly with the cache disabled, while the host has cachable aliases to the same memory. Even if the host doesnât explicitly access the memory, speculative accesses can lead to cache fills, and then changes from one or the other will get lost when the cache is cleaned or the VM enables the cache. (Cache is keyed by physical address, not VA or IPA.)
- Unaligned accesses will fault. We build the Rust code for the
- For simplicity, we just use a hardcoded pagetable (see
idmap.S
) which identity maps the first 1 GiB of address space for devices, the next 1 GiB for DRAM, and another 1 GiB higher up for more devices. This matches the memory layout that QEMU uses. - We also set up the exception vector (
vbar_el1
), which weâll see more about later. - All examples this afternoon assume we will be running at exception level 1 (EL1). If you need to run at a different exception level youâll need to modify
entry.S
accordingly.
Inline assembly
Sometimes we need to use assembly to do things that arenât possible with Rust code. For example, to make an HVC to tell the firmware to power off the system:
#![no_main] #![no_std] use core::arch::asm; use core::panic::PanicInfo; mod exceptions; const PSCI_SYSTEM_OFF: u32 = 0x84000008; #[no_mangle] extern "C" fn main(_x0: u64, _x1: u64, _x2: u64, _x3: u64) { // Safe because this only uses the declared registers and doesn't do // anything with memory. unsafe { asm!("hvc #0", inout("w0") PSCI_SYSTEM_OFF => _, inout("w1") 0 => _, inout("w2") 0 => _, inout("w3") 0 => _, inout("w4") 0 => _, inout("w5") 0 => _, inout("w6") 0 => _, inout("w7") 0 => _, options(nomem, nostack) ); } loop {} }
(If you actually want to do this, use the smccc
crate which has wrappers for all these functions.)
- PSCI is the Arm Power State Coordination Interface, a standard set of functions to manage system and CPU power states, among other things. It is implemented by EL3 firmware and hypervisors on many systems.
- The
0 => _
syntax means initialise the register to 0 before running the inline assembly code, and ignore its contents afterwards. We need to useinout
rather thanin
because the call could potentially clobber the contents of the registers. - This
main
function needs to be#[no_mangle]
andextern "C"
because it is called from our entry point inentry.S
. _x0
â_x3
are the values of registersx0
âx3
, which are conventionally used by the bootloader to pass things like a pointer to the device tree. According to the standard aarch64 calling convention (which is whatextern "C"
specifies to use), registersx0
âx7
are used for the first 8 arguments passed to a function, soentry.S
doesnât need to do anything special except make sure it doesnât change these registers.- Run the example in QEMU with
make qemu_psci
undersrc/bare-metal/aps/examples
.
Volatile memory access for MMIO
- Use
pointer::read_volatile
andpointer::write_volatile
. - Never hold a reference.
addr_of!
lets you get fields of structs without creating an intermediate reference.
- Volatile access: read or write operations may have side-effects, so prevent the compiler or hardware from reordering, duplicating or eliding them.
- Usually if you write and then read, e.g. via a mutable reference, the compiler may assume that the value read is the same as the value just written, and not bother actually reading memory.
- Some existing crates for volatile access to hardware do hold references, but this is unsound. Whenever a reference exist, the compiler may choose to dereference it.
- Use the
addr_of!
macro to get struct field pointers from a pointer to the struct.
Letâs write a UART driver
The QEMU âvirtâ machine has a PL011 UART, so letâs write a driver for that.
const FLAG_REGISTER_OFFSET: usize = 0x18; const FR_BUSY: u8 = 1 << 3; const FR_TXFF: u8 = 1 << 5; /// Minimal driver for a PL011 UART. #[derive(Debug)] pub struct Uart { base_address: *mut u8, } impl Uart { /// Constructs a new instance of the UART driver for a PL011 device at the /// given base address. /// /// # Safety /// /// The given base address must point to the 8 MMIO control registers of a /// PL011 device, which must be mapped into the address space of the process /// as device memory and not have any other aliases. pub unsafe fn new(base_address: *mut u8) -> Self { Self { base_address } } /// Writes a single byte to the UART. pub fn write_byte(&self, byte: u8) { // Wait until there is room in the TX buffer. while self.read_flag_register() & FR_TXFF != 0 {} // Safe because we know that the base address points to the control // registers of a PL011 device which is appropriately mapped. unsafe { // Write to the TX buffer. self.base_address.write_volatile(byte); } // Wait until the UART is no longer busy. while self.read_flag_register() & FR_BUSY != 0 {} } fn read_flag_register(&self) -> u8 { // Safe because we know that the base address points to the control // registers of a PL011 device which is appropriately mapped. unsafe { self.base_address.add(FLAG_REGISTER_OFFSET).read_volatile() } } }
- Note that
Uart::new
is unsafe while the other methods are safe. This is because as long as the caller ofUart::new
guarantees that its safety requirements are met (i.e. that there is only ever one instance of the driver for a given UART, and nothing else aliasing its address space), then it is always safe to callwrite_byte
later because we can assume the necessary preconditions. - We could have done it the other way around (making
new
safe butwrite_byte
unsafe), but that would be much less convenient to use as every place that callswrite_byte
would need to reason about the safety - This is a common pattern for writing safe wrappers of unsafe code: moving the burden of proof for soundness from a large number of places to a smaller number of places.
More traits
We derived the Debug
trait. It would be useful to implement a few more traits too.
use core::fmt::{self, Write}; impl Write for Uart { fn write_str(&mut self, s: &str) -> fmt::Result { for c in s.as_bytes() { self.write_byte(*c); } Ok(()) } } // Safe because it just contains a pointer to device memory, which can be // accessed from any context. unsafe impl Send for Uart {}
- Implementing
Write
lets us use thewrite!
andwriteln!
macros with ourUart
type. - Run the example in QEMU with
make qemu_minimal
undersrc/bare-metal/aps/examples
.
A better UART driver
The PL011 actually has a bunch more registers, and adding offsets to construct pointers to access them is error-prone and hard to read. Plus, some of them are bit fields which would be nice to access in a structured way.
Offset | Register name | Width |
---|---|---|
0x00 | DR | 12 |
0x04 | RSR | 4 |
0x18 | FR | 9 |
0x20 | ILPR | 8 |
0x24 | IBRD | 16 |
0x28 | FBRD | 6 |
0x2c | LCR_H | 8 |
0x30 | CR | 16 |
0x34 | IFLS | 6 |
0x38 | IMSC | 11 |
0x3c | RIS | 11 |
0x40 | MIS | 11 |
0x44 | ICR | 11 |
0x48 | DMACR | 3 |
- There are also some ID registers which have been omitted for brevity.
Bitflags
The bitflags
crate is useful for working with bitflags.
use bitflags::bitflags; bitflags! { /// Flags from the UART flag register. #[repr(transparent)] #[derive(Copy, Clone, Debug, Eq, PartialEq)] struct Flags: u16 { /// Clear to send. const CTS = 1 << 0; /// Data set ready. const DSR = 1 << 1; /// Data carrier detect. const DCD = 1 << 2; /// UART busy transmitting data. const BUSY = 1 << 3; /// Receive FIFO is empty. const RXFE = 1 << 4; /// Transmit FIFO is full. const TXFF = 1 << 5; /// Receive FIFO is full. const RXFF = 1 << 6; /// Transmit FIFO is empty. const TXFE = 1 << 7; /// Ring indicator. const RI = 1 << 8; } }
- The
bitflags!
macro creates a newtype something likeFlags(u16)
, along with a bunch of method implementations to get and set flags.
Multiple registers
We can use a struct to represent the memory layout of the UARTâs registers.
#[repr(C, align(4))] struct Registers { dr: u16, _reserved0: [u8; 2], rsr: ReceiveStatus, _reserved1: [u8; 19], fr: Flags, _reserved2: [u8; 6], ilpr: u8, _reserved3: [u8; 3], ibrd: u16, _reserved4: [u8; 2], fbrd: u8, _reserved5: [u8; 3], lcr_h: u8, _reserved6: [u8; 3], cr: u16, _reserved7: [u8; 3], ifls: u8, _reserved8: [u8; 3], imsc: u16, _reserved9: [u8; 2], ris: u16, _reserved10: [u8; 2], mis: u16, _reserved11: [u8; 2], icr: u16, _reserved12: [u8; 2], dmacr: u8, _reserved13: [u8; 3], }
#[repr(C)]
tells the compiler to lay the struct fields out in order, following the same rules as C. This is necessary for our struct to have a predictable layout, as default Rust representation allows the compiler to (among other things) reorder fields however it sees fit.
Driver
Now letâs use the new Registers
struct in our driver.
/// Driver for a PL011 UART. #[derive(Debug)] pub struct Uart { registers: *mut Registers, } impl Uart { /// Constructs a new instance of the UART driver for a PL011 device at the /// given base address. /// /// # Safety /// /// The given base address must point to the 8 MMIO control registers of a /// PL011 device, which must be mapped into the address space of the process /// as device memory and not have any other aliases. pub unsafe fn new(base_address: *mut u32) -> Self { Self { registers: base_address as *mut Registers, } } /// Writes a single byte to the UART. pub fn write_byte(&self, byte: u8) { // Wait until there is room in the TX buffer. while self.read_flag_register().contains(Flags::TXFF) {} // Safe because we know that self.registers points to the control // registers of a PL011 device which is appropriately mapped. unsafe { // Write to the TX buffer. addr_of_mut!((*self.registers).dr).write_volatile(byte.into()); } // Wait until the UART is no longer busy. while self.read_flag_register().contains(Flags::BUSY) {} } /// Reads and returns a pending byte, or `None` if nothing has been received. pub fn read_byte(&self) -> Option<u8> { if self.read_flag_register().contains(Flags::RXFE) { None } else { let data = unsafe { addr_of!((*self.registers).dr).read_volatile() }; // TODO: Check for error conditions in bits 8-11. Some(data as u8) } } fn read_flag_register(&self) -> Flags { // Safe because we know that self.registers points to the control // registers of a PL011 device which is appropriately mapped. unsafe { addr_of!((*self.registers).fr).read_volatile() } } }
- Note the use of
addr_of!
/addr_of_mut!
to get pointers to individual fields without creating an intermediate reference, which would be unsound.
Using it
Letâs write a small program using our driver to write to the serial console, and echo incoming bytes.
#![no_main] #![no_std] mod exceptions; mod pl011; use crate::pl011::Uart; use core::fmt::Write; use core::panic::PanicInfo; use log::error; use smccc::psci::system_off; use smccc::Hvc; /// Base address of the primary PL011 UART. const PL011_BASE_ADDRESS: *mut u32 = 0x900_0000 as _; #[no_mangle] extern "C" fn main(x0: u64, x1: u64, x2: u64, x3: u64) { // Safe because `PL011_BASE_ADDRESS` is the base address of a PL011 device, // and nothing else accesses that address range. let mut uart = unsafe { Uart::new(PL011_BASE_ADDRESS) }; writeln!(uart, "main({x0:#x}, {x1:#x}, {x2:#x}, {x3:#x})").unwrap(); loop { if let Some(byte) = uart.read_byte() { uart.write_byte(byte); match byte { b'\r' => { uart.write_byte(b'\n'); } b'q' => break, _ => {} } } } writeln!(uart, "Bye!").unwrap(); system_off::<Hvc>().unwrap(); }
- As in the inline assembly example, this
main
function is called from our entry point code inentry.S
. See the speaker notes there for details. - Run the example in QEMU with
make qemu
undersrc/bare-metal/aps/examples
.
Gerando Registros (Log)
It would be nice to be able to use the logging macros from the log
crate. We can do this by implementing the Log
trait.
use crate::pl011::Uart; use core::fmt::Write; use log::{LevelFilter, Log, Metadata, Record, SetLoggerError}; use spin::mutex::SpinMutex; static LOGGER: Logger = Logger { uart: SpinMutex::new(None), }; struct Logger { uart: SpinMutex<Option<Uart>>, } impl Log for Logger { fn enabled(&self, _metadata: &Metadata) -> bool { true } fn log(&self, record: &Record) { writeln!( self.uart.lock().as_mut().unwrap(), "[{}] {}", record.level(), record.args() ) .unwrap(); } fn flush(&self) {} } /// Initialises UART logger. pub fn init(uart: Uart, max_level: LevelFilter) -> Result<(), SetLoggerError> { LOGGER.uart.lock().replace(uart); log::set_logger(&LOGGER)?; log::set_max_level(max_level); Ok(()) }
- The unwrap in
log
is safe because we initialiseLOGGER
before callingset_logger
.
Using it
We need to initialise the logger before we use it.
#![no_main] #![no_std] mod exceptions; mod logger; mod pl011; use crate::pl011::Uart; use core::panic::PanicInfo; use log::{error, info, LevelFilter}; use smccc::psci::system_off; use smccc::Hvc; /// Base address of the primary PL011 UART. const PL011_BASE_ADDRESS: *mut u32 = 0x900_0000 as _; #[no_mangle] extern "C" fn main(x0: u64, x1: u64, x2: u64, x3: u64) { // Safe because `PL011_BASE_ADDRESS` is the base address of a PL011 device, // and nothing else accesses that address range. let uart = unsafe { Uart::new(PL011_BASE_ADDRESS) }; logger::init(uart, LevelFilter::Trace).unwrap(); info!("main({x0:#x}, {x1:#x}, {x2:#x}, {x3:#x})"); assert_eq!(x1, 42); system_off::<Hvc>().unwrap(); } #[panic_handler] fn panic(info: &PanicInfo) -> ! { error!("{info}"); system_off::<Hvc>().unwrap(); loop {} }
- Note that our panic handler can now log details of panics.
- Run the example in QEMU with
make qemu_logger
undersrc/bare-metal/aps/examples
.
ExceçÔes
AArch64 defines an exception vector table with 16 entries, for 4 types of exceptions (synchronous, IRQ, FIQ, SError) from 4 states (current EL with SP0, current EL with SPx, lower EL using AArch64, lower EL using AArch32). We implement this in assembly to save volatile registers to the stack before calling into Rust code:
use log::error; use smccc::psci::system_off; use smccc::Hvc; #[no_mangle] extern "C" fn sync_exception_current(_elr: u64, _spsr: u64) { error!("sync_exception_current"); system_off::<Hvc>().unwrap(); } #[no_mangle] extern "C" fn irq_current(_elr: u64, _spsr: u64) { error!("irq_current"); system_off::<Hvc>().unwrap(); } #[no_mangle] extern "C" fn fiq_current(_elr: u64, _spsr: u64) { error!("fiq_current"); system_off::<Hvc>().unwrap(); } #[no_mangle] extern "C" fn serr_current(_elr: u64, _spsr: u64) { error!("serr_current"); system_off::<Hvc>().unwrap(); } #[no_mangle] extern "C" fn sync_lower(_elr: u64, _spsr: u64) { error!("sync_lower"); system_off::<Hvc>().unwrap(); } #[no_mangle] extern "C" fn irq_lower(_elr: u64, _spsr: u64) { error!("irq_lower"); system_off::<Hvc>().unwrap(); } #[no_mangle] extern "C" fn fiq_lower(_elr: u64, _spsr: u64) { error!("fiq_lower"); system_off::<Hvc>().unwrap(); } #[no_mangle] extern "C" fn serr_lower(_elr: u64, _spsr: u64) { error!("serr_lower"); system_off::<Hvc>().unwrap(); }
- EL is exception level; all our examples this afternoon run in EL1.
- For simplicity we arenât distinguishing between SP0 and SPx for the current EL exceptions, or between AArch32 and AArch64 for the lower EL exceptions.
- For this example we just log the exception and power down, as we donât expect any of them to actually happen.
- We can think of exception handlers and our main execution context more or less like different threads.
Send
andSync
will control what we can share between them, just like with threads. For example, if we want to share some value between exception handlers and the rest of the program, and itâsSend
but notSync
, then weâll need to wrap it in something like aMutex
and put it in a static.
Other projects
- oreboot
- âcoreboot without the Câ
- Supports x86, aarch64 and RISC-V.
- Relies on LinuxBoot rather than having many drivers itself.
- Rust RaspberryPi OS tutorial
- Initialisation, UART driver, simple bootloader, JTAG, exception levels, exception handling, page tables
- Some dodginess around cache maintenance and initialisation in Rust, not necessarily a good example to copy for production code.
cargo-call-stack
- Static analysis to determine maximum stack usage.
- The RaspberryPi OS tutorial runs Rust code before the MMU and caches are enabled. This will read and write memory (e.g. the stack). However:
- Without the MMU and cache, unaligned accesses will fault. It builds with
aarch64-unknown-none
which sets+strict-align
to prevent the compiler generating unaligned accesses so it should be alright, but this is not necessarily the case in general. - If it were running in a VM, this can lead to cache coherency issues. The problem is that the VM is accessing memory directly with the cache disabled, while the host has cachable aliases to the same memory. Even if the host doesnât explicitly access the memory, speculative accesses can lead to cache fills, and then changes from one or the other will get lost. Again this is alright in this particular case (running directly on the hardware with no hypervisor), but isnât a good pattern in general.
- Without the MMU and cache, unaligned accesses will fault. It builds with
Crates Ăteis para Testes
Weâll go over a few crates which solve some common problems in bare-metal programming.
zerocopy
The zerocopy
crate (from Fuchsia) provides traits and macros for safely converting between byte sequences and other types.
use zerocopy::AsBytes; #[repr(u32)] #[derive(AsBytes, Debug, Default)] enum RequestType { #[default] In = 0, Out = 1, Flush = 4, } #[repr(C)] #[derive(AsBytes, Debug, Default)] struct VirtioBlockRequest { request_type: RequestType, reserved: u32, sector: u64, } fn main() { let request = VirtioBlockRequest { request_type: RequestType::Flush, sector: 42, ..Default::default() }; assert_eq!( request.as_bytes(), &[4, 0, 0, 0, 0, 0, 0, 0, 42, 0, 0, 0, 0, 0, 0, 0] ); }
This is not suitable for MMIO (as it doesnât use volatile reads and writes), but can be useful for working with structures shared with hardware e.g. by DMA, or sent over some external interface.
FromBytes
can be implemented for types for which any byte pattern is valid, and so can safely be converted from an untrusted sequence of bytes.- Attempting to derive
FromBytes
for these types would fail, becauseRequestType
doesnât use all possible u32 values as discriminants, so not all byte patterns are valid. zerocopy::byteorder
has types for byte-order aware numeric primitives.- Run the example with
cargo run
undersrc/bare-metal/useful-crates/zerocopy-example/
. (It wonât run in the Playground because of the crate dependency.)
aarch64-paging
The aarch64-paging
crate lets you create page tables according to the AArch64 Virtual Memory System Architecture.
use aarch64_paging::{ idmap::IdMap, paging::{Attributes, MemoryRegion}, }; const ASID: usize = 1; const ROOT_LEVEL: usize = 1; // Create a new page table with identity mapping. let mut idmap = IdMap::new(ASID, ROOT_LEVEL); // Map a 2 MiB region of memory as read-only. idmap.map_range( &MemoryRegion::new(0x80200000, 0x80400000), Attributes::NORMAL | Attributes::NON_GLOBAL | Attributes::READ_ONLY, ).unwrap(); // Set `TTBR0_EL1` to activate the page table. idmap.activate();
- For now it only supports EL1, but support for other exception levels should be straightforward to add.
- This is used in Android for the Protected VM Firmware.
- Thereâs no easy way to run this example, as it needs to run on real hardware or under QEMU.
buddy_system_allocator
buddy_system_allocator
is a third-party crate implementing a basic buddy system allocator. It can be used both for LockedHeap
implementing GlobalAlloc
so you can use the standard alloc
crate (as we saw before), or for allocating other address space. For example, we might want to allocate MMIO space for PCI BARs:
use buddy_system_allocator::FrameAllocator; use core::alloc::Layout; fn main() { let mut allocator = FrameAllocator::<32>::new(); allocator.add_frame(0x200_0000, 0x400_0000); let layout = Layout::from_size_align(0x100, 0x100).unwrap(); let bar = allocator .alloc_aligned(layout) .expect("Failed to allocate 0x100 byte MMIO region"); println!("Allocated 0x100 byte MMIO region at {:#x}", bar); }
- PCI BARs always have alignment equal to their size.
- Run the example with
cargo run
undersrc/bare-metal/useful-crates/allocator-example/
. (It wonât run in the Playground because of the crate dependency.)
tinyvec
Sometimes you want something which can be resized like a Vec
, but without heap allocation. tinyvec
provides this: a vector backed by an array or slice, which could be statically allocated or on the stack, which keeps track of how many elements are used and panics if you try to use more than are allocated.
use tinyvec::{array_vec, ArrayVec}; fn main() { let mut numbers: ArrayVec<[u32; 5]> = array_vec!(42, 66); println!("{numbers:?}"); numbers.push(7); println!("{numbers:?}"); numbers.remove(1); println!("{numbers:?}"); }
tinyvec
requires that the element type implementDefault
for initialisation.- The Rust Playground includes
tinyvec
, so this example will run fine inline.
spin
std::sync::Mutex
and the other synchronisation primitives from std::sync
are not available in core
or alloc
. How can we manage synchronisation or interior mutability, such as for sharing state between different CPUs?
The spin
crate provides spinlock-based equivalents of many of these primitives.
use spin::mutex::SpinMutex; static counter: SpinMutex<u32> = SpinMutex::new(0); fn main() { println!("count: {}", counter.lock()); *counter.lock() += 2; println!("count: {}", counter.lock()); }
- Be careful to avoid deadlock if you take locks in interrupt handlers.
spin
also has a ticket lock mutex implementation; equivalents ofRwLock
,Barrier
andOnce
fromstd::sync
; andLazy
for lazy initialisation.- The
once_cell
crate also has some useful types for late initialisation with a slightly different approach tospin::once::Once
. - The Rust Playground includes
spin
, so this example will run fine inline.
Android
To build a bare-metal Rust binary in AOSP, you need to use a rust_ffi_static
Soong rule to build your Rust code, then a cc_binary
with a linker script to produce the binary itself, and then a raw_binary
to convert the ELF to a raw binary ready to be run.
rust_ffi_static {
name: "libvmbase_example",
defaults: ["vmbase_ffi_defaults"],
crate_name: "vmbase_example",
srcs: ["src/main.rs"],
rustlibs: [
"libvmbase",
],
}
cc_binary {
name: "vmbase_example",
defaults: ["vmbase_elf_defaults"],
srcs: [
"idmap.S",
],
static_libs: [
"libvmbase_example",
],
linker_scripts: [
"image.ld",
":vmbase_sections",
],
}
raw_binary {
name: "vmbase_example_bin",
stem: "vmbase_example.bin",
src: ":vmbase_example",
enabled: false,
target: {
android_arm64: {
enabled: true,
},
},
}
vmbase
For VMs running under crosvm on aarch64, the vmbase library provides a linker script and useful defaults for the build rules, along with an entry point, UART console logging and more.
#![no_main] #![no_std] use vmbase::{main, println}; main!(main); pub fn main(arg0: u64, arg1: u64, arg2: u64, arg3: u64) { println!("Hello world"); }
- The
main!
macro marks your main function, to be called from thevmbase
entry point. - The
vmbase
entry point handles console initialisation, and issues a PSCI_SYSTEM_OFF to shutdown the VM if your main function returns.
ExercĂcios
We will write a driver for the PL031 real-time clock device.
Depois de ver os exercĂcios, vocĂȘ pode ver as soluçÔes fornecidas.
RTC driver
The QEMU aarch64 virt machine has a PL031 real-time clock at 0x9010000. For this exercise, you should write a driver for it.
- Use it to print the current time to the serial console. You can use the
chrono
crate for date/time formatting. - Use the match register and raw interrupt status to busy-wait until a given time, e.g. 3 seconds in the future. (Call
core::hint::spin_loop
inside the loop.) - Extension if you have time: Enable and handle the interrupt generated by the RTC match. You can use the driver provided in the
arm-gic
crate to configure the Arm Generic Interrupt Controller.- Use the RTC interrupt, which is wired to the GIC as
IntId::spi(2)
. - Once the interrupt is enabled, you can put the core to sleep via
arm_gic::wfi()
, which will cause the core to sleep until it receives an interrupt.
- Use the RTC interrupt, which is wired to the GIC as
Download the exercise template and look in the rtc
directory for the following files.
src/main.rs
:
#![no_main] #![no_std] mod exceptions; mod logger; mod pl011; use crate::pl011::Uart; use arm_gic::gicv3::GicV3; use core::panic::PanicInfo; use log::{error, info, trace, LevelFilter}; use smccc::psci::system_off; use smccc::Hvc; /// Base addresses of the GICv3. const GICD_BASE_ADDRESS: *mut u64 = 0x800_0000 as _; const GICR_BASE_ADDRESS: *mut u64 = 0x80A_0000 as _; /// Base address of the primary PL011 UART. const PL011_BASE_ADDRESS: *mut u32 = 0x900_0000 as _; #[no_mangle] extern "C" fn main(x0: u64, x1: u64, x2: u64, x3: u64) { // Safe because `PL011_BASE_ADDRESS` is the base address of a PL011 device, // and nothing else accesses that address range. let uart = unsafe { Uart::new(PL011_BASE_ADDRESS) }; logger::init(uart, LevelFilter::Trace).unwrap(); info!("main({:#x}, {:#x}, {:#x}, {:#x})", x0, x1, x2, x3); // Safe because `GICD_BASE_ADDRESS` and `GICR_BASE_ADDRESS` are the base // addresses of a GICv3 distributor and redistributor respectively, and // nothing else accesses those address ranges. let mut gic = unsafe { GicV3::new(GICD_BASE_ADDRESS, GICR_BASE_ADDRESS) }; gic.setup(); // TODO: Create instance of RTC driver and print current time. // TODO: Wait for 3 seconds. system_off::<Hvc>().unwrap(); } #[panic_handler] fn panic(info: &PanicInfo) -> ! { error!("{info}"); system_off::<Hvc>().unwrap(); loop {} }
src/exceptions.rs
(you should only need to change this for the 3rd part of the exercise):
#![allow(unused)] fn main() { // Copyright 2023 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. use arm_gic::gicv3::GicV3; use log::{error, info, trace}; use smccc::psci::system_off; use smccc::Hvc; #[no_mangle] extern "C" fn sync_exception_current(_elr: u64, _spsr: u64) { error!("sync_exception_current"); system_off::<Hvc>().unwrap(); } #[no_mangle] extern "C" fn irq_current(_elr: u64, _spsr: u64) { trace!("irq_current"); let intid = GicV3::get_and_acknowledge_interrupt().expect("No pending interrupt"); info!("IRQ {intid:?}"); } #[no_mangle] extern "C" fn fiq_current(_elr: u64, _spsr: u64) { error!("fiq_current"); system_off::<Hvc>().unwrap(); } #[no_mangle] extern "C" fn serr_current(_elr: u64, _spsr: u64) { error!("serr_current"); system_off::<Hvc>().unwrap(); } #[no_mangle] extern "C" fn sync_lower(_elr: u64, _spsr: u64) { error!("sync_lower"); system_off::<Hvc>().unwrap(); } #[no_mangle] extern "C" fn irq_lower(_elr: u64, _spsr: u64) { error!("irq_lower"); system_off::<Hvc>().unwrap(); } #[no_mangle] extern "C" fn fiq_lower(_elr: u64, _spsr: u64) { error!("fiq_lower"); system_off::<Hvc>().unwrap(); } #[no_mangle] extern "C" fn serr_lower(_elr: u64, _spsr: u64) { error!("serr_lower"); system_off::<Hvc>().unwrap(); } }
src/logger.rs
(you shouldnât need to change this):
#![allow(unused)] fn main() { // Copyright 2023 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. // ANCHOR: main use crate::pl011::Uart; use core::fmt::Write; use log::{LevelFilter, Log, Metadata, Record, SetLoggerError}; use spin::mutex::SpinMutex; static LOGGER: Logger = Logger { uart: SpinMutex::new(None), }; struct Logger { uart: SpinMutex<Option<Uart>>, } impl Log for Logger { fn enabled(&self, _metadata: &Metadata) -> bool { true } fn log(&self, record: &Record) { writeln!( self.uart.lock().as_mut().unwrap(), "[{}] {}", record.level(), record.args() ) .unwrap(); } fn flush(&self) {} } /// Initialises UART logger. pub fn init(uart: Uart, max_level: LevelFilter) -> Result<(), SetLoggerError> { LOGGER.uart.lock().replace(uart); log::set_logger(&LOGGER)?; log::set_max_level(max_level); Ok(()) } }
src/pl011.rs
(you shouldnât need to change this):
#![allow(unused)] fn main() { // Copyright 2023 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. #![allow(unused)] use core::fmt::{self, Write}; use core::ptr::{addr_of, addr_of_mut}; // ANCHOR: Flags use bitflags::bitflags; bitflags! { /// Flags from the UART flag register. #[repr(transparent)] #[derive(Copy, Clone, Debug, Eq, PartialEq)] struct Flags: u16 { /// Clear to send. const CTS = 1 << 0; /// Data set ready. const DSR = 1 << 1; /// Data carrier detect. const DCD = 1 << 2; /// UART busy transmitting data. const BUSY = 1 << 3; /// Receive FIFO is empty. const RXFE = 1 << 4; /// Transmit FIFO is full. const TXFF = 1 << 5; /// Receive FIFO is full. const RXFF = 1 << 6; /// Transmit FIFO is empty. const TXFE = 1 << 7; /// Ring indicator. const RI = 1 << 8; } } // ANCHOR_END: Flags bitflags! { /// Flags from the UART Receive Status Register / Error Clear Register. #[repr(transparent)] #[derive(Copy, Clone, Debug, Eq, PartialEq)] struct ReceiveStatus: u16 { /// Framing error. const FE = 1 << 0; /// Parity error. const PE = 1 << 1; /// Break error. const BE = 1 << 2; /// Overrun error. const OE = 1 << 3; } } // ANCHOR: Registers #[repr(C, align(4))] struct Registers { dr: u16, _reserved0: [u8; 2], rsr: ReceiveStatus, _reserved1: [u8; 19], fr: Flags, _reserved2: [u8; 6], ilpr: u8, _reserved3: [u8; 3], ibrd: u16, _reserved4: [u8; 2], fbrd: u8, _reserved5: [u8; 3], lcr_h: u8, _reserved6: [u8; 3], cr: u16, _reserved7: [u8; 3], ifls: u8, _reserved8: [u8; 3], imsc: u16, _reserved9: [u8; 2], ris: u16, _reserved10: [u8; 2], mis: u16, _reserved11: [u8; 2], icr: u16, _reserved12: [u8; 2], dmacr: u8, _reserved13: [u8; 3], } // ANCHOR_END: Registers // ANCHOR: Uart /// Driver for a PL011 UART. #[derive(Debug)] pub struct Uart { registers: *mut Registers, } impl Uart { /// Constructs a new instance of the UART driver for a PL011 device at the /// given base address. /// /// # Safety /// /// The given base address must point to the MMIO control registers of a /// PL011 device, which must be mapped into the address space of the process /// as device memory and not have any other aliases. pub unsafe fn new(base_address: *mut u32) -> Self { Self { registers: base_address as *mut Registers, } } /// Writes a single byte to the UART. pub fn write_byte(&self, byte: u8) { // Wait until there is room in the TX buffer. while self.read_flag_register().contains(Flags::TXFF) {} // Safe because we know that self.registers points to the control // registers of a PL011 device which is appropriately mapped. unsafe { // Write to the TX buffer. addr_of_mut!((*self.registers).dr).write_volatile(byte.into()); } // Wait until the UART is no longer busy. while self.read_flag_register().contains(Flags::BUSY) {} } /// Reads and returns a pending byte, or `None` if nothing has been received. pub fn read_byte(&self) -> Option<u8> { if self.read_flag_register().contains(Flags::RXFE) { None } else { let data = unsafe { addr_of!((*self.registers).dr).read_volatile() }; // TODO: Check for error conditions in bits 8-11. Some(data as u8) } } fn read_flag_register(&self) -> Flags { // Safe because we know that self.registers points to the control // registers of a PL011 device which is appropriately mapped. unsafe { addr_of!((*self.registers).fr).read_volatile() } } } // ANCHOR_END: Uart impl Write for Uart { fn write_str(&mut self, s: &str) -> fmt::Result { for c in s.as_bytes() { self.write_byte(*c); } Ok(()) } } // Safe because it just contains a pointer to device memory, which can be // accessed from any context. unsafe impl Send for Uart {} }
Cargo.toml
(you shouldnât need to change this):
[workspace]
[package]
name = "rtc"
version = "0.1.0"
edition = "2021"
publish = false
[dependencies]
arm-gic = "0.1.0"
bitflags = "2.0.0"
chrono = { version = "0.4.24", default-features = false }
log = "0.4.17"
smccc = "0.1.1"
spin = "0.9.8"
[build-dependencies]
cc = "1.0.73"
build.rs
(you shouldnât need to change this):
// Copyright 2023 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. use cc::Build; use std::env; fn main() { #[cfg(target_os = "linux")] env::set_var("CROSS_COMPILE", "aarch64-linux-gnu"); #[cfg(not(target_os = "linux"))] env::set_var("CROSS_COMPILE", "aarch64-none-elf"); Build::new() .file("entry.S") .file("exceptions.S") .file("idmap.S") .compile("empty") }
entry.S
(you shouldnât need to change this):
/*
* Copyright 2023 Google LLC
*
* Licensed under the Apache License, Version 2.0 (the "License");
* you may not use this file except in compliance with the License.
* You may obtain a copy of the License at
*
* https://www.apache.org/licenses/LICENSE-2.0
*
* Unless required by applicable law or agreed to in writing, software
* distributed under the License is distributed on an "AS IS" BASIS,
* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
* See the License for the specific language governing permissions and
* limitations under the License.
*/
.macro adr_l, reg:req, sym:req
adrp \reg, \sym
add \reg, \reg, :lo12:\sym
.endm
.macro mov_i, reg:req, imm:req
movz \reg, :abs_g3:\imm
movk \reg, :abs_g2_nc:\imm
movk \reg, :abs_g1_nc:\imm
movk \reg, :abs_g0_nc:\imm
.endm
.set .L_MAIR_DEV_nGnRE, 0x04
.set .L_MAIR_MEM_WBWA, 0xff
.set .Lmairval, .L_MAIR_DEV_nGnRE | (.L_MAIR_MEM_WBWA << 8)
/* 4 KiB granule size for TTBR0_EL1. */
.set .L_TCR_TG0_4KB, 0x0 << 14
/* 4 KiB granule size for TTBR1_EL1. */
.set .L_TCR_TG1_4KB, 0x2 << 30
/* Disable translation table walk for TTBR1_EL1, generating a translation fault instead. */
.set .L_TCR_EPD1, 0x1 << 23
/* Translation table walks for TTBR0_EL1 are inner sharable. */
.set .L_TCR_SH_INNER, 0x3 << 12
/*
* Translation table walks for TTBR0_EL1 are outer write-back read-allocate write-allocate
* cacheable.
*/
.set .L_TCR_RGN_OWB, 0x1 << 10
/*
* Translation table walks for TTBR0_EL1 are inner write-back read-allocate write-allocate
* cacheable.
*/
.set .L_TCR_RGN_IWB, 0x1 << 8
/* Size offset for TTBR0_EL1 is 2**39 bytes (512 GiB). */
.set .L_TCR_T0SZ_512, 64 - 39
.set .Ltcrval, .L_TCR_TG0_4KB | .L_TCR_TG1_4KB | .L_TCR_EPD1 | .L_TCR_RGN_OWB
.set .Ltcrval, .Ltcrval | .L_TCR_RGN_IWB | .L_TCR_SH_INNER | .L_TCR_T0SZ_512
/* Stage 1 instruction access cacheability is unaffected. */
.set .L_SCTLR_ELx_I, 0x1 << 12
/* SP alignment fault if SP is not aligned to a 16 byte boundary. */
.set .L_SCTLR_ELx_SA, 0x1 << 3
/* Stage 1 data access cacheability is unaffected. */
.set .L_SCTLR_ELx_C, 0x1 << 2
/* EL0 and EL1 stage 1 MMU enabled. */
.set .L_SCTLR_ELx_M, 0x1 << 0
/* Privileged Access Never is unchanged on taking an exception to EL1. */
.set .L_SCTLR_EL1_SPAN, 0x1 << 23
/* SETEND instruction disabled at EL0 in aarch32 mode. */
.set .L_SCTLR_EL1_SED, 0x1 << 8
/* Various IT instructions are disabled at EL0 in aarch32 mode. */
.set .L_SCTLR_EL1_ITD, 0x1 << 7
.set .L_SCTLR_EL1_RES1, (0x1 << 11) | (0x1 << 20) | (0x1 << 22) | (0x1 << 28) | (0x1 << 29)
.set .Lsctlrval, .L_SCTLR_ELx_M | .L_SCTLR_ELx_C | .L_SCTLR_ELx_SA | .L_SCTLR_EL1_ITD | .L_SCTLR_EL1_SED
.set .Lsctlrval, .Lsctlrval | .L_SCTLR_ELx_I | .L_SCTLR_EL1_SPAN | .L_SCTLR_EL1_RES1
/**
* This is a generic entry point for an image. It carries out the operations required to prepare the
* loaded image to be run. Specifically, it zeroes the bss section using registers x25 and above,
* prepares the stack, enables floating point, and sets up the exception vector. It preserves x0-x3
* for the Rust entry point, as these may contain boot parameters.
*/
.section .init.entry, "ax"
.global entry
entry:
/* Load and apply the memory management configuration, ready to enable MMU and caches. */
adrp x30, idmap
msr ttbr0_el1, x30
mov_i x30, .Lmairval
msr mair_el1, x30
mov_i x30, .Ltcrval
/* Copy the supported PA range into TCR_EL1.IPS. */
mrs x29, id_aa64mmfr0_el1
bfi x30, x29, #32, #4
msr tcr_el1, x30
mov_i x30, .Lsctlrval
/*
* Ensure everything before this point has completed, then invalidate any potentially stale
* local TLB entries before they start being used.
*/
isb
tlbi vmalle1
ic iallu
dsb nsh
isb
/*
* Configure sctlr_el1 to enable MMU and cache and don't proceed until this has completed.
*/
msr sctlr_el1, x30
isb
/* Disable trapping floating point access in EL1. */
mrs x30, cpacr_el1
orr x30, x30, #(0x3 << 20)
msr cpacr_el1, x30
isb
/* Zero out the bss section. */
adr_l x29, bss_begin
adr_l x30, bss_end
0: cmp x29, x30
b.hs 1f
stp xzr, xzr, [x29], #16
b 0b
1: /* Prepare the stack. */
adr_l x30, boot_stack_end
mov sp, x30
/* Set up exception vector. */
adr x30, vector_table_el1
msr vbar_el1, x30
/* Call into Rust code. */
bl main
/* Loop forever waiting for interrupts. */
2: wfi
b 2b
exceptions.S
(you shouldnât need to change this):
/*
* Copyright 2023 Google LLC
*
* Licensed under the Apache License, Version 2.0 (the "License");
* you may not use this file except in compliance with the License.
* You may obtain a copy of the License at
*
* https://www.apache.org/licenses/LICENSE-2.0
*
* Unless required by applicable law or agreed to in writing, software
* distributed under the License is distributed on an "AS IS" BASIS,
* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
* See the License for the specific language governing permissions and
* limitations under the License.
*/
/**
* Saves the volatile registers onto the stack. This currently takes 14
* instructions, so it can be used in exception handlers with 18 instructions
* left.
*
* On return, x0 and x1 are initialised to elr_el2 and spsr_el2 respectively,
* which can be used as the first and second arguments of a subsequent call.
*/
.macro save_volatile_to_stack
/* Reserve stack space and save registers x0-x18, x29 & x30. */
stp x0, x1, [sp, #-(8 * 24)]!
stp x2, x3, [sp, #8 * 2]
stp x4, x5, [sp, #8 * 4]
stp x6, x7, [sp, #8 * 6]
stp x8, x9, [sp, #8 * 8]
stp x10, x11, [sp, #8 * 10]
stp x12, x13, [sp, #8 * 12]
stp x14, x15, [sp, #8 * 14]
stp x16, x17, [sp, #8 * 16]
str x18, [sp, #8 * 18]
stp x29, x30, [sp, #8 * 20]
/*
* Save elr_el1 & spsr_el1. This such that we can take nested exception
* and still be able to unwind.
*/
mrs x0, elr_el1
mrs x1, spsr_el1
stp x0, x1, [sp, #8 * 22]
.endm
/**
* Restores the volatile registers from the stack. This currently takes 14
* instructions, so it can be used in exception handlers while still leaving 18
* instructions left; if paired with save_volatile_to_stack, there are 4
* instructions to spare.
*/
.macro restore_volatile_from_stack
/* Restore registers x2-x18, x29 & x30. */
ldp x2, x3, [sp, #8 * 2]
ldp x4, x5, [sp, #8 * 4]
ldp x6, x7, [sp, #8 * 6]
ldp x8, x9, [sp, #8 * 8]
ldp x10, x11, [sp, #8 * 10]
ldp x12, x13, [sp, #8 * 12]
ldp x14, x15, [sp, #8 * 14]
ldp x16, x17, [sp, #8 * 16]
ldr x18, [sp, #8 * 18]
ldp x29, x30, [sp, #8 * 20]
/* Restore registers elr_el1 & spsr_el1, using x0 & x1 as scratch. */
ldp x0, x1, [sp, #8 * 22]
msr elr_el1, x0
msr spsr_el1, x1
/* Restore x0 & x1, and release stack space. */
ldp x0, x1, [sp], #8 * 24
.endm
/**
* This is a generic handler for exceptions taken at the current EL while using
* SP0. It behaves similarly to the SPx case by first switching to SPx, doing
* the work, then switching back to SP0 before returning.
*
* Switching to SPx and calling the Rust handler takes 16 instructions. To
* restore and return we need an additional 16 instructions, so we can implement
* the whole handler within the allotted 32 instructions.
*/
.macro current_exception_sp0 handler:req
msr spsel, #1
save_volatile_to_stack
bl \handler
restore_volatile_from_stack
msr spsel, #0
eret
.endm
/**
* This is a generic handler for exceptions taken at the current EL while using
* SPx. It saves volatile registers, calls the Rust handler, restores volatile
* registers, then returns.
*
* This also works for exceptions taken from EL0, if we don't care about
* non-volatile registers.
*
* Saving state and jumping to the Rust handler takes 15 instructions, and
* restoring and returning also takes 15 instructions, so we can fit the whole
* handler in 30 instructions, under the limit of 32.
*/
.macro current_exception_spx handler:req
save_volatile_to_stack
bl \handler
restore_volatile_from_stack
eret
.endm
.section .text.vector_table_el1, "ax"
.global vector_table_el1
.balign 0x800
vector_table_el1:
sync_cur_sp0:
current_exception_sp0 sync_exception_current
.balign 0x80
irq_cur_sp0:
current_exception_sp0 irq_current
.balign 0x80
fiq_cur_sp0:
current_exception_sp0 fiq_current
.balign 0x80
serr_cur_sp0:
current_exception_sp0 serr_current
.balign 0x80
sync_cur_spx:
current_exception_spx sync_exception_current
.balign 0x80
irq_cur_spx:
current_exception_spx irq_current
.balign 0x80
fiq_cur_spx:
current_exception_spx fiq_current
.balign 0x80
serr_cur_spx:
current_exception_spx serr_current
.balign 0x80
sync_lower_64:
current_exception_spx sync_lower
.balign 0x80
irq_lower_64:
current_exception_spx irq_lower
.balign 0x80
fiq_lower_64:
current_exception_spx fiq_lower
.balign 0x80
serr_lower_64:
current_exception_spx serr_lower
.balign 0x80
sync_lower_32:
current_exception_spx sync_lower
.balign 0x80
irq_lower_32:
current_exception_spx irq_lower
.balign 0x80
fiq_lower_32:
current_exception_spx fiq_lower
.balign 0x80
serr_lower_32:
current_exception_spx serr_lower
idmap.S
(you shouldnât need to change this):
/*
* Copyright 2023 Google LLC
*
* Licensed under the Apache License, Version 2.0 (the "License");
* you may not use this file except in compliance with the License.
* You may obtain a copy of the License at
*
* https://www.apache.org/licenses/LICENSE-2.0
*
* Unless required by applicable law or agreed to in writing, software
* distributed under the License is distributed on an "AS IS" BASIS,
* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
* See the License for the specific language governing permissions and
* limitations under the License.
*/
.set .L_TT_TYPE_BLOCK, 0x1
.set .L_TT_TYPE_PAGE, 0x3
.set .L_TT_TYPE_TABLE, 0x3
/* Access flag. */
.set .L_TT_AF, 0x1 << 10
/* Not global. */
.set .L_TT_NG, 0x1 << 11
.set .L_TT_XN, 0x3 << 53
.set .L_TT_MT_DEV, 0x0 << 2 // MAIR #0 (DEV_nGnRE)
.set .L_TT_MT_MEM, (0x1 << 2) | (0x3 << 8) // MAIR #1 (MEM_WBWA), inner shareable
.set .L_BLOCK_DEV, .L_TT_TYPE_BLOCK | .L_TT_MT_DEV | .L_TT_AF | .L_TT_XN
.set .L_BLOCK_MEM, .L_TT_TYPE_BLOCK | .L_TT_MT_MEM | .L_TT_AF | .L_TT_NG
.section ".rodata.idmap", "a", %progbits
.global idmap
.align 12
idmap:
/* level 1 */
.quad .L_BLOCK_DEV | 0x0 // 1 GiB of device mappings
.quad .L_BLOCK_MEM | 0x40000000 // 1 GiB of DRAM
.fill 254, 8, 0x0 // 254 GiB of unmapped VA space
.quad .L_BLOCK_DEV | 0x4000000000 // 1 GiB of device mappings
.fill 255, 8, 0x0 // 255 GiB of remaining VA space
image.ld
(you shouldnât need to change this):
/*
* Copyright 2023 Google LLC
*
* Licensed under the Apache License, Version 2.0 (the "License");
* you may not use this file except in compliance with the License.
* You may obtain a copy of the License at
*
* https://www.apache.org/licenses/LICENSE-2.0
*
* Unless required by applicable law or agreed to in writing, software
* distributed under the License is distributed on an "AS IS" BASIS,
* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
* See the License for the specific language governing permissions and
* limitations under the License.
*/
/*
* Code will start running at this symbol which is placed at the start of the
* image.
*/
ENTRY(entry)
MEMORY
{
image : ORIGIN = 0x40080000, LENGTH = 2M
}
SECTIONS
{
/*
* Collect together the code.
*/
.init : ALIGN(4096) {
text_begin = .;
*(.init.entry)
*(.init.*)
} >image
.text : {
*(.text.*)
} >image
text_end = .;
/*
* Collect together read-only data.
*/
.rodata : ALIGN(4096) {
rodata_begin = .;
*(.rodata.*)
} >image
.got : {
*(.got)
} >image
rodata_end = .;
/*
* Collect together the read-write data including .bss at the end which
* will be zero'd by the entry code.
*/
.data : ALIGN(4096) {
data_begin = .;
*(.data.*)
/*
* The entry point code assumes that .data is a multiple of 32
* bytes long.
*/
. = ALIGN(32);
data_end = .;
} >image
/* Everything beyond this point will not be included in the binary. */
bin_end = .;
/* The entry point code assumes that .bss is 16-byte aligned. */
.bss : ALIGN(16) {
bss_begin = .;
*(.bss.*)
*(COMMON)
. = ALIGN(16);
bss_end = .;
} >image
.stack (NOLOAD) : ALIGN(4096) {
boot_stack_begin = .;
. += 40 * 4096;
. = ALIGN(4096);
boot_stack_end = .;
} >image
. = ALIGN(4K);
PROVIDE(dma_region = .);
/*
* Remove unused sections from the image.
*/
/DISCARD/ : {
/* The image loads itself so doesn't need these sections. */
*(.gnu.hash)
*(.hash)
*(.interp)
*(.eh_frame_hdr)
*(.eh_frame)
*(.note.gnu.build-id)
}
}
Makefile
(you shouldnât need to change this):
# Copyright 2023 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.
UNAME := $(shell uname -s)
ifeq ($(UNAME),Linux)
TARGET = aarch64-linux-gnu
else
TARGET = aarch64-none-elf
endif
OBJCOPY = $(TARGET)-objcopy
.PHONY: build qemu_minimal qemu qemu_logger
all: rtc.bin
build:
cargo build
rtc.bin: build
$(OBJCOPY) -O binary target/aarch64-unknown-none/debug/rtc $@
qemu: rtc.bin
qemu-system-aarch64 -machine virt,gic-version=3 -cpu max -serial mon:stdio -display none -kernel $< -s
clean:
cargo clean
rm -f *.bin
.cargo/config.toml
(you shouldnât need to change this):
[build]
target = "aarch64-unknown-none"
rustflags = ["-C", "link-arg=-Timage.ld"]
Run the code in QEMU with make qemu
.
Welcome to Concurrency in Rust
Rust tem suporte total para concorrĂȘncia usando threads do SO com mutexes e channels (canais).
O sistema de tipos do Rust desempenha um papel importante na conversĂŁo de muitos erros de concorrĂȘncia em erros de tempo de compilação. Isso geralmente Ă© chamado de concorrĂȘncia sem medo, pois vocĂȘ pode confiar no compilador para garantir a exatidĂŁo no tempo de execução.
Threads
Threads em Rust funcionam de maneira semelhante Ă s threads em outras linguagens:
use std::thread; use std::time::Duration; fn main() { thread::spawn(|| { for i in 1..10 { println!("Count in thread: {i}!"); thread::sleep(Duration::from_millis(5)); } }); for i in 1..5 { println!("Main thread: {i}"); thread::sleep(Duration::from_millis(5)); } }
- Threads sĂŁo todas âdaemon threadsâ, o thread principal nĂŁo espera por elas.
- âPanicsâ em threads sĂŁo independentes uns dos outros.
- âPanicsâ podem carregar um payload (carga Ăștil), que pode ser descompactado com
downcast_ref
.
- âPanicsâ podem carregar um payload (carga Ăștil), que pode ser descompactado com
Pontos chave:
-
Notice that the thread is stopped before it reaches 10 â the main thread is not waiting.
-
Use
let handle = thread::spawn(...)
and laterhandle.join()
to wait for the thread to finish. -
Trigger a panic in the thread, notice how this doesnât affect
main
. -
Use the
Result
return value fromhandle.join()
to get access to the panic payload. This is a good time to talk aboutAny
.
Threads com Escopo
Threads normais nĂŁo podem emprestar de seu ambiente:
use std::thread; fn foo() { let s = String::from("OlĂĄ"); thread::spawn(|| { println!("Length: {}", s.len()); }); } fn main() { foo(); }
No entanto, vocĂȘ pode usar uma thread com escopo para isso:
use std::thread; fn main() { let s = String::from("OlĂĄ"); thread::scope(|scope| { scope.spawn(|| { println!("Length: {}", s.len()); }); }); }
- The reason for that is that when the
thread::scope
function completes, all the threads are guaranteed to be joined, so they can return borrowed data. - Normal Rust borrowing rules apply: you can either borrow mutably by one thread, or immutably by any number of threads.
Canais (channels)
Os channels (canais) em Rust tĂȘm duas partes: um Sender<T>
e um Receiver<T>
. As duas partes estĂŁo conectadas atravĂ©s do channel, mas vocĂȘ sĂł vĂȘ os end-points.
use std::sync::mpsc; use std::thread; fn main() { let (tx, rx) = mpsc::channel(); tx.send(10).unwrap(); tx.send(20).unwrap(); println!("Received: {:?}", rx.recv()); println!("Received: {:?}", rx.recv()); let tx2 = tx.clone(); tx2.send(30).unwrap(); println!("Received: {:?}", rx.recv()); }
mpsc
significa Multi-Produtor, Ănico-Consumidor.Sender
eSyncSender
implementamClone
(entĂŁo vocĂȘ pode criar vĂĄrios produtores), masReceiver
(consumidores) nĂŁo.send()
erecv()
retornamResult
. Se retornaremErr
, significa que a contraparteSender
ouReceiver
Ă© descartada e o canal Ă© fechado.
Canais Ilimitados
VocĂȘ obtĂ©m um canal ilimitado e assĂncrono com mpsc::channel()
:
use std::sync::mpsc; use std::thread; use std::time::Duration; fn main() { let (tx, rx) = mpsc::channel(); thread::spawn(move || { let thread_id = thread::current().id(); for i in 1..10 { tx.send(format!("Message {i}")).unwrap(); println!("{thread_id:?}: sent Message {i}"); } println!("{thread_id:?}: done"); }); thread::sleep(Duration::from_millis(100)); for msg in rx.iter() { println!("Main: got {msg}"); } }
Canais Delimitados
With bounded (synchronous) channels, send
can block the current thread:
use std::sync::mpsc; use std::thread; use std::time::Duration; fn main() { let (tx, rx) = mpsc::sync_channel(3); thread::spawn(move || { let thread_id = thread::current().id(); for i in 1..10 { tx.send(format!("Message {i}")).unwrap(); println!("{thread_id:?}: sent Message {i}"); } println!("{thread_id:?}: done"); }); thread::sleep(Duration::from_millis(100)); for msg in rx.iter() { println!("Main: got {msg}"); } }
- Calling
send
will block the current thread until there is space in the channel for the new message. The thread can be blocked indefinitely if there is nobody who reads from the channel. - A call to
send
will abort with an error (that is why it returnsResult
) if the channel is closed. A channel is closed when the receiver is dropped. - A bounded channel with a size of zero is called a ârendezvous channelâ. Every send will block the current thread until another thread calls
read
.
Send
e Sync
Como o Rust sabe proibir o acesso compartilhado entre threads? A resposta estĂĄ em duas caracterĂsticas:
Send
: um tipoT
Ă©Send
se for seguro mover umT
entre threadsSync
: um tipoT
Ă©Sync
se for seguro mover um&T
entre threads
Send
e Sync
sĂŁo unsafe traits
. O compilador os derivarĂĄ automaticamente para seus tipos desde que contenham apenas os tipos Send
e Sync
. VocĂȘ tambĂ©m pode implementĂĄ-los manualmente quando souber que sĂŁo vĂĄlidos.
- One can think of these traits as markers that the type has certain thread-safety properties.
- They can be used in the generic constraints as normal traits.
Send
Um tipo
T
Ă©Send
se for seguro mover um valorT
para outro thread.
O efeito de mover a propriedade (ownership) para outro thread Ă© que os destructors serĂŁo executados nessa thread. EntĂŁo a questĂŁo Ă©: quando vocĂȘ pode alocar um valor em um thread e desalocĂĄ-lo em outro?
As an example, a connection to the SQLite library must only be accessed from a single thread.
Sync
Um tipo
T
Ă©Sync
se for seguro acessar um valorT
de vĂĄrias threads ao mesmo tempo.
Mais precisamente, a definição é:
T
Ă©Sync
se e somente se&T
Ă©Send
Essa instrução Ă© essencialmente uma maneira abreviada de dizer que, se um tipo Ă© thread-safe para uso compartilhado, tambĂ©m Ă© thread-safe passar referĂȘncias a ele entre threads.
Isso ocorre porque, se um tipo for Sync
, significa que ele pode ser compartilhado entre vĂĄrios threads sem o risco de corridas de dados ou outros problemas de sincronização, portanto, Ă© seguro movĂȘ-lo para outro thread. Uma referĂȘncia ao tipo tambĂ©m Ă© segura para mover para outro thread, porque os dados a que ela faz referĂȘncia podem ser acessados de qualquer thread com segurança.
Exemplos
Send + Sync
A maioria dos tipos que vocĂȘ encontra sĂŁo Send + Sync
:
i8
,f32
,bool
,char
,&str
, âŠ(T1, T2)
,[T; N]
,&[T]
,struct { x: T }
, âŠString
,Option<T>
,Vec<T>
,Box<T>
, âŠArc<T>
: Explicitamente thread-safe via contagem de referĂȘncia atĂŽmica.Mutex<T>
: Explicitamente thread-safe via bloqueio interno.AtomicBool
,AtomicU8
, âŠ: Usa instruçÔes atĂŽmicas especiais.
Os tipos genéricos são tipicamente Send + Sync
quando os parĂąmetros de tipo sĂŁo Send + Sync
.
Send + !Sync
Esses tipos podem ser movidos para outras threads, mas nĂŁo sĂŁo seguros para threads. Normalmente por causa da mutabilidade interior:
mpsc::Sender<T>
mpsc::Receiver<T>
Cell<T>
RefCell<T>
!Send + Sync
Esses tipos sĂŁo thread-safe, mas nĂŁo podem ser movidos para outro thread:
MutexGuard<T>
: Usa primitivas a nĂvel de sistema operacional que devem ser desalocadas no thread que as criou.
!Send + !Sync
Esses tipos nĂŁo sĂŁo thread-safe e nĂŁo podem ser movidos para outros threads:
Rc<T>
: cadaRc<T>
tem uma referĂȘncia a umRcBox<T>
, que contĂ©m uma contagem de referĂȘncia nĂŁo atĂŽmica.*const T
,*mut T
: Rust assume que ponteiros brutos podem ter consideraçÔes de especiais de concorrĂȘncia.
Estado Compartilhado
Rust usa o sistema de tipos para impor a sincronização de dados compartilhados. Isso é feito principalmente através de dois tipos:
Arc<T>
, referĂȘncia atĂŽmica contadaT
: manipula o compartilhamento entre threads e toma o cuidado de desalocarT
quando a Ășltima referĂȘncia Ă© descartada,Mutex<T>
: garante acesso mutuamente exclusivo ao valorT
.
Arc
Arc<T>
allows shared read-only access via Arc::clone
:
use std::thread; use std::sync::Arc; fn main() { let v = Arc::new(vec![10, 20, 30]); let mut handles = Vec::new(); for _ in 1..5 { let v = Arc::clone(&v); handles.push(thread::spawn(move || { let thread_id = thread::current().id(); println!("{thread_id:?}: {v:?}"); })); } handles.into_iter().for_each(|h| h.join().unwrap()); println!("v: {v:?}"); }
Arc
significa âAtomic Reference Countedâ, uma versĂŁo thread-safe deRc
que usa operaçÔes atÎmicas.Arc<T>
implementsClone
whether or notT
does. It implementsSend
andSync
if and only ifT
implements them both.Arc::clone()
tem o custo das operaçÔes atÎmicas que são executadas, mas depois disso o uso doT
Ă© gratuito.- Cuidado com os ciclos de referĂȘncia,
Arc
nĂŁo usa um coletor de lixo para detectĂĄ-los.std::sync::Weak
pode ajudar.
Mutex
Mutex<T>
garante exclusĂŁo mĂștua e permite acesso mutĂĄvel a T
por trĂĄs de uma interface somente leitura:
use std::sync::Mutex; fn main() { let v = Mutex::new(vec![10, 20, 30]); println!("v: {:?}", v.lock().unwrap()); { let mut guard = v.lock().unwrap(); guard.push(40); } println!("v: {:?}", v.lock().unwrap()); }
Observe como temos uma implementação impl<T: Send> Sync for Mutex<T>
encoberta.
Mutex
in Rust looks like a collection with just one element - the protected data.- It is not possible to forget to acquire the mutex before accessing the protected data.
- You can get an
&mut T
from an&Mutex<T>
by taking the lock. TheMutexGuard
ensures that the&mut T
doesnât outlive the lock being held. Mutex<T>
implements bothSend
andSync
iff (if and only if)T
implementsSend
.- A read-write lock counterpart -
RwLock
. - Why does
lock()
return aResult
?- If the thread that held the
Mutex
panicked, theMutex
becomes âpoisonedâ to signal that the data it protected might be in an inconsistent state. Callinglock()
on a poisoned mutex fails with aPoisonError
. You can callinto_inner()
on the error to recover the data regardless.
- If the thread that held the
Exemplo
Vamos ver Arc
e Mutex
em ação:
use std::thread; // use std::sync::{Arc, Mutex}; fn main() { let v = vec![10, 20, 30]; let handle = thread::spawn(|| { v.push(10); }); v.push(1000); handle.join().unwrap(); println!("v: {v:?}"); }
Possible solution:
use std::sync::{Arc, Mutex}; use std::thread; fn main() { let v = Arc::new(Mutex::new(vec![10, 20, 30])); let v2 = Arc::clone(&v); let handle = thread::spawn(move || { let mut v2 = v2.lock().unwrap(); v2.push(10); }); { let mut v = v.lock().unwrap(); v.push(1000); } handle.join().unwrap(); println!("v: {v:?}"); }
Notable parts:
v
is wrapped in bothArc
andMutex
, because their concerns are orthogonal.- Wrapping a
Mutex
in anArc
is a common pattern to share mutable state between threads.
- Wrapping a
v: Arc<_>
needs to be cloned asv2
before it can be moved into another thread. Notemove
was added to the lambda signature.- Blocks are introduced to narrow the scope of the
LockGuard
as much as possible.
ExercĂcios
Vamos praticar nossas novas habilidades de concorrĂȘncia com:
-
Dining philosophers: a classic problem in concurrency.
-
Multi-threaded link checker: a larger project where youâll use Cargo to download dependencies and then check links in parallel.
Depois de ver os exercĂcios, vocĂȘ pode ver as soluçÔes fornecidas.
FilĂłsofos Jantando
O problema dos filĂłsofos jantando Ă© um problema clĂĄssico em concorrĂȘncia:
Cinco filĂłsofos jantam juntos na mesma mesa. Cada folĂłsofo tem seu prĂłprio lugar Ă mesa. HĂĄ um garfo entre cada prato. O prato servido Ă© uma espĂ©cie de espaguete que se come com dois garfos. Cada filĂłsofo pode somente pensar ou comer, alternadamente. AlĂ©m disso, um filĂłsofo sĂł pode comer seu espaguete quando ele tĂȘm garfo esquerdo e direito. Assim, dois garfos sĂł estarĂŁo disponĂveis quando seus dois vizinhos mais prĂłximos estiverem pensando, nĂŁo comendo. Depois de um filĂłsofo individual termina de comer, ele abaixa os dois garfos.
You will need a local Cargo installation for this exercise. Copy the code below to a file called src/main.rs
, fill out the blanks, and test that cargo run
does not deadlock:
use std::sync::{mpsc, Arc, Mutex}; use std::thread; use std::time::Duration; struct Fork; struct Philosopher { name: String, // left_fork: ... // right_fork: ... // thoughts: ... } impl Philosopher { fn think(&self) { self.thoughts .send(format!("Eureka! {} has a new idea!", &self.name)) .unwrap(); } fn eat(&self) { // Pick up forks... println!("{} is eating...", &self.name); thread::sleep(Duration::from_millis(10)); } } static PHILOSOPHERS: &[&str] = &["Socrates", "Plato", "Aristotle", "Thales", "Pythagoras"]; fn main() { // Create forks // Create philosophers // Make each of them think and eat 100 times // Output their thoughts }
You can use the following Cargo.toml
:
[package]
name = "dining-philosophers"
version = "0.1.0"
edition = "2021"
Verificador de Links Multi-Threads
Vamos usar nosso novo conhecimento para criar um verificador de links multi-threads. Comece em uma pĂĄgina da web e verifique se os links na pĂĄgina sĂŁo vĂĄlidos. Verifique recursivamente outras pĂĄginas no mesmo domĂnio e continue fazendo isso atĂ© que todas as pĂĄginas tenham sido validadas.
Para isso, vocĂȘ precisarĂĄ de um cliente HTTP como reqwest
. Crie um novo Project com o Cargo e adicione reqwest
como uma dependĂȘncia:
cargo new link-checker
cd link-checker
cargo add --features blocking,rustls-tls reqwest
Se
cargo add
falhar comerror: no such subcommand
, edite o arquivoCargo.toml
Ă mĂŁo. Adicione as dependĂȘncias listadas abaixo.
VocĂȘ tambĂ©m precisarĂĄ de uma maneira de encontrar links. Podemos usar scraper
para isso:
cargo add scraper
Por fim, precisaremos de alguma forma de lidar com os erros. Usamos thiserror
para isso:
cargo add thiserror
As chamadas cargo add
irĂŁo atualizar o arquivo Cargo.toml
para ficar assim:
[package]
name = "link-checker"
version = "0.1.0"
edition = "2021"
publish = false
[dependencies]
reqwest = { version = "0.11.12", features = ["blocking", "rustls-tls"] }
scraper = "0.13.0"
thiserror = "1.0.37"
Agora vocĂȘ pode baixar a pĂĄgina inicial. Tente com um pequeno site como https://www.google.org/
.
Seu arquivo src/main.rs
deve se parecer com isto:
use reqwest::{blocking::Client, Url}; use scraper::{Html, Selector}; use thiserror::Error; #[derive(Error, Debug)] enum Error { #[error("request error: {0}")] ReqwestError(#[from] reqwest::Error), #[error("bad http response: {0}")] BadResponse(String), } #[derive(Debug)] struct CrawlCommand { url: Url, extract_links: bool, } fn visit_page(client: &Client, command: &CrawlCommand) -> Result<Vec<Url>, Error> { println!("Checking {:#}", command.url); let response = client.get(command.url.clone()).send()?; if !response.status().is_success() { return Err(Error::BadResponse(response.status().to_string())); } let mut link_urls = Vec::new(); if !command.extract_links { return Ok(link_urls); } let base_url = response.url().to_owned(); let body_text = response.text()?; let document = Html::parse_document(&body_text); let selector = Selector::parse("a").unwrap(); let href_values = document .select(&selector) .filter_map(|element| element.value().attr("href")); for href in href_values { match base_url.join(href) { Ok(link_url) => { link_urls.push(link_url); } Err(err) => { println!("On {base_url:#}: ignored unparsable {href:?}: {err}"); } } } Ok(link_urls) } fn main() { let client = Client::new(); let start_url = Url::parse("https://www.google.org").unwrap(); let crawl_command = CrawlCommand{ url: start_url, extract_links: true }; match visit_page(&client, &crawl_command) { Ok(links) => println!("Links: {links:#?}"), Err(err) => println!("Could not extract links: {err:#}"), } }
Execute o cĂłdigo em src/main.rs
com
cargo run
Tarefas
- Use threads para verificar os links em paralelo: envie as URLs a serem verificadas para um channel e deixe alguns threads verificarem as URLs em paralelo.
- Estenda isso para extrair recursivamente links de todas as pĂĄginas no domĂnio
www.google.org
. Coloque um limite mĂĄximo de 100 pĂĄginas ou menos para que vocĂȘ nĂŁo acabe sendo bloqueado pelo site.
Async Rust
âAsyncâ is a concurrency model where multiple tasks are executed concurrently by executing each task until it would block, then switching to another task that is ready to make progress. The model allows running a larger number of tasks on a limited number of threads. This is because the per-task overhead is typically very low and operating systems provide primitives for efficiently identifying I/O that is able to proceed.
Rustâs asynchronous operation is based on âfuturesâ, which represent work that may be completed in the future. Futures are âpolledâ until they signal that they are complete.
Futures are polled by an async runtime, and several different runtimes are available.
Comparisons
-
Python has a similar model in its
asyncio
. However, itsFuture
type is callback-based, and not polled. Async Python programs require a âloopâ, similar to a runtime in Rust. -
JavaScriptâs
Promise
is similar, but again callback-based. The language runtime implements the event loop, so many of the details of Promise resolution are hidden.
async
/await
At a high level, async Rust code looks very much like ânormalâ sequential code:
use futures::executor::block_on; async fn count_to(count: i32) { for i in 1..=count { println!("Count is: {i}!"); } } async fn async_main(count: i32) { count_to(count).await; } fn main() { block_on(async_main(10)); }
Pontos chave:
-
Note that this is a simplified example to show the syntax. There is no long running operation or any real concurrency in it!
-
What is the return type of an async call?
- Use
let future: () = async_main(10);
inmain
to see the type.
- Use
-
The âasyncâ keyword is syntactic sugar. The compiler replaces the return type with a future.
-
You cannot make
main
async, without additional instructions to the compiler on how to use the returned future. -
You need an executor to run async code.
block_on
blocks the current thread until the provided future has run to completion. -
.await
asynchronously waits for the completion of another operation. Unlikeblock_on
,.await
doesnât block the current thread. -
.await
can only be used inside anasync
function (or block; these are introduced later).
Closures
Future
is a trait, implemented by objects that represent an operation that may not be complete yet. A future can be polled, and poll
returns a Poll
.
#![allow(unused)] fn main() { use std::pin::Pin; use std::task::Context; pub trait Future { type Output; fn poll(self: Pin<&mut Self>, cx: &mut Context<'_>) -> Poll<Self::Output>; } pub enum Poll<T> { Ready(T), Pending, } }
An async function returns an impl Future
. Itâs also possible (but uncommon) to implement Future
for your own types. For example, the JoinHandle
returned from tokio::spawn
implements Future
to allow joining to it.
The .await
keyword, applied to a Future, causes the current async function to pause until that Future is ready, and then evaluates to its output.
-
The
Future
andPoll
types are implemented exactly as shown; click the links to show the implementations in the docs. -
We will not get to
Pin
andContext
, as we will focus on writing async code, rather than building new async primitives. Briefly:-
Context
allows a Future to schedule itself to be polled again when an event occurs. -
Pin
ensures that the Future isnât moved in memory, so that pointers into that future remain valid. This is required to allow references to remain valid after an.await
.
-
Tempos de Execução
A runtime provides support for performing operations asynchronously (a reactor) and is responsible for executing futures (an executor). Rust does not have a âbuilt-inâ runtime, but several options are available:
- Tokio: performant, with a well-developed ecosystem of functionality like Hyper for HTTP or Tonic for gRPC.
- async-std: aims to be a âstd for asyncâ, and includes a basic runtime in
async::task
. - smol: simple and lightweight
Several larger applications have their own runtimes. For example, Fuchsia already has one.
-
Note that of the listed runtimes, only Tokio is supported in the Rust playground. The playground also does not permit any I/O, so most interesting async things canât run in the playground.
-
Futures are âinertâ in that they do not do anything (not even start an I/O operation) unless there is an executor polling them. This differs from JS Promises, for example, which will run to completion even if they are never used.
Tokio
Tokio provides:
- A multi-threaded runtime for executing asynchronous code.
- An asynchronous version of the standard library.
- A large ecosystem of libraries.
use tokio::time; async fn count_to(count: i32) { for i in 1..=count { println!("Count in task: {i}!"); time::sleep(time::Duration::from_millis(5)).await; } } #[tokio::main] async fn main() { tokio::spawn(count_to(10)); for i in 1..5 { println!("Main task: {i}"); time::sleep(time::Duration::from_millis(5)).await; } }
-
With the
tokio::main
macro we can now makemain
async. -
The
spawn
function creates a new, concurrent âtaskâ. -
Note:
spawn
takes aFuture
, you donât call.await
oncount_to
.
Further exploration:
-
Why does
count_to
not (usually) get to 10? This is an example of async cancellation.tokio::spawn
returns a handle which can be awaited to wait until it finishes. -
Try
count_to(10).await
instead of spawning. -
Try awaiting the task returned from
tokio::spawn
.
Tarefas
Rust has a task system, which is a form of lightweight threading.
A task has a single top-level future which the executor polls to make progress. That future may have one or more nested futures that its poll
method polls, corresponding loosely to a call stack. Concurrency within a task is possible by polling multiple child futures, such as racing a timer and an I/O operation.
use tokio::io::{self, AsyncReadExt, AsyncWriteExt}; use tokio::net::TcpListener; #[tokio::main] async fn main() -> io::Result<()> { let listener = TcpListener::bind("127.0.0.1:6142").await?; println!("listening on port 6142"); loop { let (mut socket, addr) = listener.accept().await?; println!("connection from {addr:?}"); tokio::spawn(async move { if let Err(e) = socket.write_all(b"Who are you?\n").await { println!("socket error: {e:?}"); return; } let mut buf = vec![0; 1024]; let reply = match socket.read(&mut buf).await { Ok(n) => { let name = std::str::from_utf8(&buf[..n]).unwrap().trim(); format!("Thanks for dialing in, {name}!\n") } Err(e) => { println!("socket error: {e:?}"); return; } }; if let Err(e) = socket.write_all(reply.as_bytes()).await { println!("socket error: {e:?}"); } }); } }
Copy this example into your prepared src/main.rs
and run it from there.
-
Ask students to visualize what the state of the example server would be with a few connected clients. What tasks exist? What are their Futures?
-
This is the first time weâve seen an
async
block. This is similar to a closure, but does not take any arguments. Its return value is a Future, similar to anasync fn
. -
Refactor the async block into a function, and improve the error handling using
?
.
Canais AssĂncronos
Several crates have support for asynchronous channels. For instance tokio
:
use tokio::sync::mpsc::{self, Receiver}; async fn ping_handler(mut input: Receiver<()>) { let mut count: usize = 0; while let Some(_) = input.recv().await { count += 1; println!("Received {count} pings so far."); } println!("ping_handler complete"); } #[tokio::main] async fn main() { let (sender, receiver) = mpsc::channel(32); let ping_handler_task = tokio::spawn(ping_handler(receiver)); for i in 0..10 { sender.send(()).await.expect("Failed to send ping."); println!("Sent {} pings so far.", i + 1); } drop(sender); ping_handler_task.await.expect("Something went wrong in ping handler task."); }
-
Change the channel size to
3
and see how it affects the execution. -
Overall, the interface is similar to the
sync
channels as seen in the morning class. -
Try removing the
std::mem::drop
call. What happens? Why? -
The Flume crate has channels that implement both
sync
andasync
send
andrecv
. This can be convenient for complex applications with both IO and heavy CPU processing tasks. -
What makes working with
async
channels preferable is the ability to combine them with otherfuture
s to combine them and create complex control flow.
Futures Control Flow
Futures can be combined together to produce concurrent compute flow graphs. We have already seen tasks, that function as independent threads of execution.
Join
A join operation waits until all of a set of futures are ready, and returns a collection of their results. This is similar to Promise.all
in JavaScript or asyncio.gather
in Python.
use anyhow::Result; use futures::future; use reqwest; use std::collections::HashMap; async fn size_of_page(url: &str) -> Result<usize> { let resp = reqwest::get(url).await?; Ok(resp.text().await?.len()) } #[tokio::main] async fn main() { let urls: [&str; 4] = [ "https://google.com", "https://httpbin.org/ip", "https://play.rust-lang.org/", "BAD_URL", ]; let futures_iter = urls.into_iter().map(size_of_page); let results = future::join_all(futures_iter).await; let page_sizes_dict: HashMap<&str, Result<usize>> = urls.into_iter().zip(results.into_iter()).collect(); println!("{:?}", page_sizes_dict); }
Copy this example into your prepared src/main.rs
and run it from there.
-
For multiple futures of disjoint types, you can use
std::future::join!
but you must know how many futures you will have at compile time. This is currently in thefutures
crate, soon to be stabilised instd::future
. -
The risk of
join
is that one of the futures may never resolve, this would cause your program to stall. -
You can also combine
join_all
withjoin!
for instance to join all requests to an http service as well as a database query. Try adding atokio::time::sleep
to the future, usingfutures::join!
. This is not a timeout (that requiresselect!
, explained in the next chapter), but demonstratesjoin!
.
Select
A select operation waits until any of a set of futures is ready, and responds to that futureâs result. In JavaScript, this is similar to Promise.race
. In Python, it compares to asyncio.wait(task_set, return_when=asyncio.FIRST_COMPLETED)
.
Similar to a match statement, the body of select!
has a number of arms, each of the form pattern = future => statement
. When the future
is ready, the statement
is executed with the variables in pattern
bound to the future
âs result.
use tokio::sync::mpsc::{self, Receiver}; use tokio::time::{sleep, Duration}; #[derive(Debug, PartialEq)] enum Animal { Cat { name: String }, Dog { name: String }, } async fn first_animal_to_finish_race( mut cat_rcv: Receiver<String>, mut dog_rcv: Receiver<String>, ) -> Option<Animal> { tokio::select! { cat_name = cat_rcv.recv() => Some(Animal::Cat { name: cat_name? }), dog_name = dog_rcv.recv() => Some(Animal::Dog { name: dog_name? }) } } #[tokio::main] async fn main() { let (cat_sender, cat_receiver) = mpsc::channel(32); let (dog_sender, dog_receiver) = mpsc::channel(32); tokio::spawn(async move { sleep(Duration::from_millis(500)).await; cat_sender .send(String::from("Felix")) .await .expect("Failed to send cat."); }); tokio::spawn(async move { sleep(Duration::from_millis(50)).await; dog_sender .send(String::from("Rex")) .await .expect("Failed to send dog."); }); let winner = first_animal_to_finish_race(cat_receiver, dog_receiver) .await .expect("Failed to receive winner"); println!("Winner is {winner:?}"); }
-
In this example, we have a race between a cat and a dog.
first_animal_to_finish_race
listens to both channels and will pick whichever arrives first. Since the dog takes 50ms, it wins against the cat that take 500ms seconds. -
You can use
oneshot
channels in this example as the channels are supposed to receive only onesend
. -
Try adding a deadline to the race, demonstrating selecting different sorts of futures.
-
Note that
select!
drops unmatched branches, which cancels their futures. It is easiest to use when every execution ofselect!
creates new futures.- An alternative is to pass
&mut future
instead of the future itself, but this can lead to issues, further discussed in the pinning slide.
- An alternative is to pass
Pitfalls of async/await
Async / await provides convenient and efficient abstraction for concurrent asynchronous programming. However, the async/await model in Rust also comes with its share of pitfalls and footguns. We illustrate some of them in this chapter:
Blocking the executor
Most async runtimes only allow IO tasks to run concurrently. This means that CPU blocking tasks will block the executor and prevent other tasks from being executed. An easy workaround is to use async equivalent methods where possible.
use futures::future::join_all; use std::time::Instant; async fn sleep_ms(start: &Instant, id: u64, duration_ms: u64) { std::thread::sleep(std::time::Duration::from_millis(duration_ms)); println!( "future {id} slept for {duration_ms}ms, finished after {}ms", start.elapsed().as_millis() ); } #[tokio::main(flavor = "current_thread")] async fn main() { let start = Instant::now(); let sleep_futures = (1..=10).map(|t| sleep_ms(&start, t, t * 10)); join_all(sleep_futures).await; }
-
Run the code and see that the sleeps happen consecutively rather than concurrently.
-
The
"current_thread"
flavor puts all tasks on a single thread. This makes the effect more obvious, but the bug is still present in the multi-threaded flavor. -
Switch the
std::thread::sleep
totokio::time::sleep
and await its result. -
Another fix would be to
tokio::task::spawn_blocking
which spawns an actual thread and transforms its handle into a future without blocking the executor. -
You should not think of tasks as OS threads. They do not map 1 to 1 and most executors will allow many tasks to run on a single OS thread. This is particularly problematic when interacting with other libraries via FFI, where that library might depend on thread-local storage or map to specific OS threads (e.g., CUDA). Prefer
tokio::task::spawn_blocking
in such situations. -
Use sync mutexes with care. Holding a mutex over an
.await
may cause another task to block, and that task may be running on the same thread.
Pin
When you await a future, all local variables (that would ordinarily be stored on a stack frame) are instead stored in the Future for the current async block. If your future has pointers to data on the stack, those pointers might get invalidated. This is unsafe.
Therefore, you must guarantee that the addresses your future points to donât change. That is why we need to pin
futures. Using the same future repeatedly in a select!
often leads to issues with pinned values.
use tokio::sync::{mpsc, oneshot}; use tokio::task::spawn; use tokio::time::{sleep, Duration}; // A work item. In this case, just sleep for the given time and respond // with a message on the `respond_on` channel. #[derive(Debug)] struct Work { input: u32, respond_on: oneshot::Sender<u32>, } // A worker which listens for work on a queue and performs it. async fn worker(mut work_queue: mpsc::Receiver<Work>) { let mut iterations = 0; loop { tokio::select! { Some(work) = work_queue.recv() => { sleep(Duration::from_millis(10)).await; // Pretend to work. work.respond_on .send(work.input * 1000) .expect("failed to send response"); iterations += 1; } // TODO: report number of iterations every 100ms } } } // A requester which requests work and waits for it to complete. async fn do_work(work_queue: &mpsc::Sender<Work>, input: u32) -> u32 { let (tx, rx) = oneshot::channel(); work_queue .send(Work { input, respond_on: tx, }) .await .expect("failed to send on work queue"); rx.await.expect("failed waiting for response") } #[tokio::main] async fn main() { let (tx, rx) = mpsc::channel(10); spawn(worker(rx)); for i in 0..100 { let resp = do_work(&tx, i).await; println!("work result for iteration {i}: {resp}"); } }
-
You may recognize this as an example of the actor pattern. Actors typically call
select!
in a loop. -
This serves as a summation of a few of the previous lessons, so take your time with it.
-
Naively add a
_ = sleep(Duration::from_millis(100)) => { println!(..) }
to theselect!
. This will never execute. Why? -
Instead, add a
timeout_fut
containing that future outside of theloop
:#![allow(unused)] fn main() { let mut timeout_fut = sleep(Duration::from_millis(100)); loop { select! { .., _ = timeout_fut => { println!(..); }, } } }
-
This still doesnât work. Follow the compiler errors, adding
&mut
to thetimeout_fut
in theselect!
to work around the move, then usingBox::pin
:#![allow(unused)] fn main() { let mut timeout_fut = Box::pin(sleep(Duration::from_millis(100))); loop { select! { .., _ = &mut timeout_fut => { println!(..); }, } } }
-
This compiles, but once the timeout expires it is
Poll::Ready
on every iteration (a fused future would help with this). Update to resettimeout_fut
every time it expires.
-
-
Box allocates on the heap. In some cases,
std::pin::pin!
(only recently stabilized, with older code often usingtokio::pin!
) is also an option, but that is difficult to use for a future that is reassigned. -
Another alternative is to not use
pin
at all but spawn another task that will send to aoneshot
channel every 100ms.
Traits (CaracterĂsticas)
Async methods in traits are not yet supported in the stable channel (An experimental feature exists in nightly and should be stabilized in the mid term.)
The crate async_trait provides a workaround through a macro:
use async_trait::async_trait; use std::time::Instant; use tokio::time::{sleep, Duration}; #[async_trait] trait Sleeper { async fn sleep(&self); } struct FixedSleeper { sleep_ms: u64, } #[async_trait] impl Sleeper for FixedSleeper { async fn sleep(&self) { sleep(Duration::from_millis(self.sleep_ms)).await; } } async fn run_all_sleepers_multiple_times(sleepers: Vec<Box<dyn Sleeper>>, n_times: usize) { for _ in 0..n_times { println!("running all sleepers.."); for sleeper in &sleepers { let start = Instant::now(); sleeper.sleep().await; println!("slept for {}ms", start.elapsed().as_millis()); } } } #[tokio::main] async fn main() { let sleepers: Vec<Box<dyn Sleeper>> = vec![ Box::new(FixedSleeper { sleep_ms: 50 }), Box::new(FixedSleeper { sleep_ms: 100 }), ]; run_all_sleepers_multiple_times(sleepers, 5).await; }
-
async_trait
is easy to use, but note that itâs using heap allocations to achieve this. This heap allocation has performance overhead. -
The challenges in language support for
async trait
are deep Rust and probably not worth describing in-depth. Niko Matsakis did a good job of explaining them in this post if you are interested in digging deeper. -
Try creating a new sleeper struct that will sleep for a random amount of time and adding it to the Vec.
Cancelar
Dropping a future implies it can never be polled again. This is called cancellation and it can occur at any await
point. Care is needed to ensure the system works correctly even when futures are cancelled. For example, it shouldnât deadlock or lose data.
use std::io::{self, ErrorKind}; use std::time::Duration; use tokio::io::{AsyncReadExt, AsyncWriteExt, DuplexStream}; struct LinesReader { stream: DuplexStream, } impl LinesReader { fn new(stream: DuplexStream) -> Self { Self { stream } } async fn next(&mut self) -> io::Result<Option<String>> { let mut bytes = Vec::new(); let mut buf = [0]; while self.stream.read(&mut buf[..]).await? != 0 { bytes.push(buf[0]); if buf[0] == b'\n' { break; } } if bytes.is_empty() { return Ok(None) } let s = String::from_utf8(bytes) .map_err(|_| io::Error::new(ErrorKind::InvalidData, "not UTF-8"))?; Ok(Some(s)) } } async fn slow_copy(source: String, mut dest: DuplexStream) -> std::io::Result<()> { for b in source.bytes() { dest.write_u8(b).await?; tokio::time::sleep(Duration::from_millis(10)).await } Ok(()) } #[tokio::main] async fn main() -> std::io::Result<()> { let (client, server) = tokio::io::duplex(5); let handle = tokio::spawn(slow_copy("hi\nthere\n".to_owned(), client)); let mut lines = LinesReader::new(server); let mut interval = tokio::time::interval(Duration::from_millis(60)); loop { tokio::select! { _ = interval.tick() => println!("tick!"), line = lines.next() => if let Some(l) = line? { print!("{}", l) } else { break }, } } handle.await.unwrap()?; Ok(()) }
-
The compiler doesnât help with cancellation-safety. You need to read API documentation and consider what state your
async fn
holds. -
Unlike
panic
and?
, cancellation is part of normal control flow (vs error-handling). -
The example loses parts of the string.
-
Whenever the
tick()
branch finishes first,next()
and itsbuf
are dropped. -
LinesReader
can be made cancellation-safe by makeingbuf
part of the struct:#![allow(unused)] fn main() { struct LinesReader { stream: DuplexStream, bytes: Vec<u8>, buf: [u8; 1], } impl LinesReader { fn new(stream: DuplexStream) -> Self { Self { stream, bytes: Vec::new(), buf: [0] } } async fn next(&mut self) -> io::Result<Option<String>> { // prefix buf and bytes with self. // ⊠let raw = std::mem::take(&mut self.bytes); let s = String::from_utf8(raw) // ⊠} } }
-
-
Interval::tick
is cancellation-safe because it keeps track of whether a tick has been âdeliveredâ. -
AsyncReadExt::read
is cancellation-safe because it either returns or doesnât read data. -
AsyncBufReadExt::read_line
is similar to the example and isnât cancellation-safe. See its documentation for details and alternatives.
ExercĂcios
To practice your Async Rust skills, we have again two exercises for you:
-
Dining philosophers: we already saw this problem in the morning. This time you are going to implement it with Async Rust.
-
A Broadcast Chat Application: this is a larger project that allows you experiment with more advanced Async Rust features.
Depois de ver os exercĂcios, vocĂȘ pode ver as soluçÔes fornecidas.
Dining Philosophers - Async
See dining philosophers for a description of the problem.
As before, you will need a local Cargo installation for this exercise. Copy the code below to a file called src/main.rs
, fill out the blanks, and test that cargo run
does not deadlock:
use std::sync::Arc; use tokio::time; use tokio::sync::mpsc::{self, Sender}; use tokio::sync::Mutex; struct Fork; struct Philosopher { name: String, // left_fork: ... // right_fork: ... // thoughts: ... } impl Philosopher { async fn think(&self) { self.thoughts .send(format!("Eureka! {} has a new idea!", &self.name)).await .unwrap(); } async fn eat(&self) { // Pick up forks... println!("{} is eating...", &self.name); time::sleep(time::Duration::from_millis(5)).await; } } static PHILOSOPHERS: &[&str] = &["Socrates", "Plato", "Aristotle", "Thales", "Pythagoras"]; #[tokio::main] async fn main() { // Create forks // Create philosophers // Make them think and eat // Output their thoughts }
Since this time you are using Async Rust, youâll need a tokio
dependency. You can use the following Cargo.toml
:
[package]
name = "dining-philosophers-async-dine"
version = "0.1.0"
edition = "2021"
[dependencies]
tokio = {version = "1.26.0", features = ["sync", "time", "macros", "rt-multi-thread"]}
Also note that this time you have to use the Mutex
and the mpsc
module from the tokio
crate.
- Can you make your implementation single-threaded?
Broadcast Chat Application
In this exercise, we want to use our new knowledge to implement a broadcast chat application. We have a chat server that the clients connect to and publish their messages. The client reads user messages from the standard input, and sends them to the server. The chat server broadcasts each message that it receives to all the clients.
For this, we use a broadcast channel on the server, and tokio_websockets
for the communication between the client and the server.
Create a new Cargo project and add the following dependencies:
Cargo.toml
:
[package]
name = "chat-async"
version = "0.1.0"
edition = "2021"
[dependencies]
futures-util = "0.3.28"
http = "0.2.9"
tokio = { version = "1.28.1", features = ["full"] }
tokio-websockets = "0.3.2"
The required APIs
You are going to need the following functions from tokio
and tokio_websockets
. Spend a few minutes to familiarize yourself with the API.
- WebsocketStream::next(): for asynchronously reading messages from a Websocket Stream.
- SinkExt::send() implemented by
WebsocketStream
: for asynchronously sending messages on a Websocket Stream. - Lines::next_line(): for asynchronously reading user messages from the standard input.
- Sender::subscribe(): for subscribing to a broadcast channel.
Two binaries
Normally in a Cargo project, you can have only one binary, and one src/main.rs
file. In this project, we need two binaries. One for the client, and one for the server. You could potentially make them two separate Cargo projects, but we are going to put them in a single Cargo project with two binaries. For this to work, the client and the server code should go under src/bin
(see the documentation).
Copy the following server and client code into src/bin/server.rs
and src/bin/client.rs
, respectively. Your task is to complete these files as described below.
src/bin/server.rs
:
use futures_util::sink::SinkExt; use std::error::Error; use std::net::SocketAddr; use tokio::net::{TcpListener, TcpStream}; use tokio::sync::broadcast::{channel, Sender}; use tokio_websockets::{Message, ServerBuilder, WebsocketStream}; async fn handle_connection( addr: SocketAddr, mut ws_stream: WebsocketStream<TcpStream>, bcast_tx: Sender<String>, ) -> Result<(), Box<dyn Error + Send + Sync>> { // TODO: For a hint, see the description of the task below. } #[tokio::main] async fn main() -> Result<(), Box<dyn Error + Send + Sync>> { let (bcast_tx, _) = channel(16); let listener = TcpListener::bind("127.0.0.1:2000").await?; println!("listening on port 2000"); loop { let (socket, addr) = listener.accept().await?; println!("New connection from {addr:?}"); let bcast_tx = bcast_tx.clone(); tokio::spawn(async move { // Wrap the raw TCP stream into a websocket. let ws_stream = ServerBuilder::new().accept(socket).await?; handle_connection(addr, ws_stream, bcast_tx).await }); } }
src/bin/client.rs
:
use futures_util::SinkExt; use http::Uri; use tokio::io::{AsyncBufReadExt, BufReader}; use tokio_websockets::{ClientBuilder, Message}; #[tokio::main] async fn main() -> Result<(), tokio_websockets::Error> { let mut ws_stream = ClientBuilder::from_uri(Uri::from_static("ws://127.0.0.1:2000")) .connect() .await?; let stdin = tokio::io::stdin(); let mut stdin = BufReader::new(stdin).lines(); // TODO: For a hint, see the description of the task below. }
Running the binaries
Run the server with:
cargo run --bin server
and the client with:
cargo run --bin client
Tarefas
- Implement the
handle_connection
function insrc/bin/server.rs
.- Hint: Use
tokio::select!
for concurrently performing two tasks in a continuous loop. One task receives messages from the client and broadcasts them. The other sends messages received by the server to the client.
- Hint: Use
- Complete the main function in
src/bin/client.rs
.- Hint: As before, use
tokio::select!
in a continuous loop for concurrently performing two tasks: (1) reading user messages from standard input and sending them to the server, and (2) receiving messages from the server, and displaying them for the user.
- Hint: As before, use
- Optional: Once you are done, change the code to broadcast messages to all clients, but the sender of the message.
Obrigado!
Obrigado por fazer o Comprehensive Rust đŠ! Esperamos que tenha gostado e que tenha sido Ăștil.
NĂłs nos divertimos muito montando o curso. O curso nĂŁo Ă© perfeito, portanto, se vocĂȘ identificou algum erro ou tem ideias para melhorias, entre em entre em contato conosco em GitHub. NĂłs adorarĂamos ouvir vocĂȘ.
Outros recursos de Rust
A comunidade Rust tem abundĂąncia de recursos gratuitos e de alta qualidade on-line.
Documentação Oficial
O projeto Rust hospeda muitos recursos. Estes cobrem Rust em geral:
- A Linguagem de Programação Rust: o livro gratuito canĂŽnico sobre Rust. Abrange o idioma em detalhes e inclui alguns projetos para as pessoas construĂrem.
- Rust By Example: abrange a sintaxe de Rust por meio de uma sĂ©rie de exemplos que mostram diferentes construçÔes. As vezes inclui pequenos exercĂcios onde vocĂȘ Ă© solicitado a expandir o cĂłdigo dos exemplos.
- Rust Standard Library: documentação completa da biblioteca padrão para Rust.
- The Rust Reference: um livro incompleto que descreve a gramĂĄtica Rust e o modelo de memĂłria.
Mais guias especializados hospedados no site oficial do Rust:
- O Rustonomicon: cobre Rust inseguro, incluindo trabalhar com ponteiros brutos e fazer interface com outras linguagens (FFI).
- Programação assĂncrona em Rust: abrange o novo modelo de programação assĂncrona que foi introduzido apĂłs o Rust Book ser escrito.
- The Embedded Rust Book: uma introdução ao uso do Rust em dispositivos embarcados sem um sistema operacional.
Material de aprendizagem nĂŁo oficial
Uma pequena seleção de outros guias e tutoriais para Rust:
- Learn Rust the Dangerous Way: covers Rust from the perspective of low-level C programmers.
- Rust for Embedded C Programmers: covers Rust from the perspective of developers who write firmware in C.
- Rust for professionals: covers the syntax of Rust using side-by-side comparisons with other languages such as C, C++, Java, JavaScript, and Python.
- Rust on Exercism: 100+ exercises to help you learn Rust.
- Ferrous Teaching Material: a series of small presentations covering both basic and advanced part of the Rust language. Other topics such as WebAssembly, and async/await are also covered.
- Beginnerâs Series to Rust and Take your first steps with Rust: two Rust guides aimed at new developers. The first is a set of 35 videos and the second is a set of 11 modules which covers Rust syntax and basic constructs.
- Learn Rust With Entirely Too Many Linked Lists: in-depth exploration of Rustâs memory management rules, through implementing a few different types of list structures.
Consulte o Little Book of Rust Books para ainda mais livros Rust.
Créditos
O material aqui se baseia em muitas fontes excelentes de documentação do Rust. Consulte a pĂĄgina em outros recursos para obter uma lista completa de recursos Ășteis .
The material of Comprehensive Rust is licensed under the terms of the Apache 2.0 license, please see LICENSE
for details.
Rust by Example
Alguns exemplos e exercĂcios foram copiados e adaptados de Rust by Exemplo. por favor veja o diretĂłrio third_party/rust-by-example/
para detalhes, incluindo os termos de licença.
Rust on Exercism
Alguns exercĂcios foram copiados e adaptados de Rust on Exercism. por favor veja o diretĂłrio third_party/rust-on-exercism/
para obter detalhes, incluindo os termos licença.
CXX
A seção Interoperability with C++ usa uma imagem de CXX. Consulte o diretório third_party/cxx/
para obter detalhes, incluindo os termos da licença.
SoluçÔes
VocĂȘ encontrarĂĄ soluçÔes para os exercĂcios nas pĂĄginas seguintes.
Sinta-se Ă vontade para fazer perguntas sobre as soluçÔes no GitHub. Nos informe se vocĂȘ tiver uma solução diferente ou melhor do que a apresentada aqui.
Nota: Ignore os comentĂĄrios
// ANCHOR: label
e// ANCHOR_END: label
que vocĂȘ vĂȘ nas soluçÔes. Eles estĂŁo lĂĄ para tornar possĂvel reutilizar partes das soluçÔes como exercĂcios.
Dia 1 ExercĂcios matinais
Matrizes (Arrays) e Loops (Laços) for
// Copyright 2022 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. // ANCHOR: transpose fn transpose(matrix: [[i32; 3]; 3]) -> [[i32; 3]; 3] { // ANCHOR_END: transpose let mut result = [[0; 3]; 3]; for i in 0..3 { for j in 0..3 { result[j][i] = matrix[i][j]; } } return result; } // ANCHOR: pretty_print fn pretty_print(matrix: &[[i32; 3]; 3]) { // ANCHOR_END: pretty_print for row in matrix { println!("{row:?}"); } } // ANCHOR: tests #[test] fn test_transpose() { let matrix = [ [101, 102, 103], // [201, 202, 203], [301, 302, 303], ]; let transposed = transpose(matrix); assert_eq!( transposed, [ [101, 201, 301], // [102, 202, 302], [103, 203, 303], ] ); } // ANCHOR_END: tests // ANCHOR: main fn main() { let matrix = [ [101, 102, 103], // <-- o comentĂĄrio faz com que o rustfmt adicione uma nova linha [201, 202, 203], [301, 302, 303], ]; println!("matriz:"); pretty_print(&matrix); let transposed = transpose(matrix); println!("transposta:"); pretty_print(&transposed); }
Bonus question
Isso necessita a utilização de conceitos mais avançados. Pode parecer que poderĂamos usar uma slice de slices (&[&[i32]]
) como o tipo de entrada para transposta
e, assim, fazer nossa função lidar com qualquer tamanho de matriz. No entanto, isso falha rapidamente: o tipo de retorno não pode ser &[&[i32]]
, pois ele precisa possuir os dados que vocĂȘ retorna.
VocĂȘ pode tentar usar algo como Vec<Vec<i32>>
, mas isso tambĂ©m nĂŁo funciona muito bem: Ă© difĂcil converter de Vec<Vec<i32>>
para &[&[i32]]
entĂŁo agora vocĂȘ tambĂ©m nĂŁo pode usar impressao_formatada
facilmente.
Assim que chegarmos aos traits and generics, podemos usar o trait std::convert::AsRef
para abstrair qualquer coisa que pode ser referenciada como um slice.
use std::convert::AsRef; use std::fmt::Debug; fn pretty_print<T, Line, Matrix>(matrix: Matrix) where T: Debug, // A line references a slice of items Line: AsRef<[T]>, // A matrix references a slice of lines Matrix: AsRef<[Line]> { for row in matrix.as_ref() { println!("{:?}", row.as_ref()); } } fn main() { // &[&[i32]] pretty_print(&[&[1, 2, 3], &[4, 5, 6], &[7, 8, 9]]); // [[&str; 2]; 2] pretty_print([["a", "b"], ["c", "d"]]); // Vec<Vec<i32>> pretty_print(vec![vec![1, 2], vec![3, 4]]); }
Além disso, o próprio tipo não imporia que as slices filhas tenham o mesmo comprimento, portanto, tal variåvel poderia conter uma matriz invålida.
Dia 1 ExercĂcios da Tarde
Algoritmo de Luhn
// Copyright 2022 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. // ANCHOR: luhn pub fn luhn(cc_number: &str) -> bool { // ANCHOR_END: luhn let mut digits_seen = 0; let mut sum = 0; for (i, ch) in cc_number.chars().rev().filter(|&ch| ch != ' ').enumerate() { match ch.to_digit(10) { Some(d) => { sum += if i % 2 == 1 { let dd = d * 2; dd / 10 + dd % 10 } else { d }; digits_seen += 1; } None => return false, } } if digits_seen < 2 { return false; } sum % 10 == 0 } fn main() { let cc_number = "1234 5678 1234 5670"; println!( "Is {cc_number} a valid credit card number? {}", if luhn(cc_number) { "sim" } else { "nĂŁo" } ); } // ANCHOR: unit-tests #[test] fn test_non_digit_cc_number() { assert!(!luhn("foo")); } #[test] fn test_empty_cc_number() { assert!(!luhn("")); assert!(!luhn(" ")); assert!(!luhn(" ")); assert!(!luhn(" ")); } #[test] fn test_single_digit_cc_number() { assert!(!luhn("0")); } #[test] fn test_two_digit_cc_number() { assert!(luhn(" 0 0 ")); } #[test] fn test_valid_cc_number() { assert!(luhn("4263 9826 4026 9299")); assert!(luhn("4539 3195 0343 6467")); assert!(luhn("7992 7398 713")); } #[test] fn test_invalid_cc_number() { assert!(!luhn("4223 9826 4026 9299")); assert!(!luhn("4539 3195 0343 6476")); assert!(!luhn("8273 1232 7352 0569")); } // ANCHOR_END: unit-tests
Pattern matching
TBD.
Dia 2 ExercĂcios matinais
Projetando uma biblioteca
// Copyright 2022 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. // ANCHOR: setup struct Library { books: Vec<Book>, } struct Book { title: String, year: u16, } impl Book { // Este Ă© um construtor, utilizado abaixo. fn new(title: &str, year: u16) -> Book { Book { title: String::from(title), year, } } } // Implemente os mĂ©todos abaixo. Atualize o parĂąmetro `self` para // indicar o nĂvel requerido de ownership sobre o objeto: // // - `&self` para acesso compartilhado de apenas leitura, // - `&mut self` para acesso mutĂĄvel exclusivo, // - `self` para acesso exclusivo por valor. impl Library { // ANCHOR_END: setup // ANCHOR: Library_new fn new() -> Library { // ANCHOR_END: Library_new Library { books: Vec::new() } } // ANCHOR: Library_len //fn len(self) -> usize { // todo!("Return the length of `self.books`") //} // ANCHOR_END: Library_len fn len(&self) -> usize { self.books.len() } // ANCHOR: Library_is_empty //fn is_empty(self) -> bool { // todo!("Return `true` if `self.books` is empty") //} // ANCHOR_END: Library_is_empty fn is_empty(&self) -> bool { self.books.is_empty() } // ANCHOR: Library_add_book //fn add_book(self, book: Book) { // todo!("Add a new book to `self.books`") //} // ANCHOR_END: Library_add_book fn add_book(&mut self, book: Book) { self.books.push(book) } // ANCHOR: Library_print_books //fn print_books(self) { // todo!("Iterate over `self.books` and each book's title and year") //} // ANCHOR_END: Library_print_books fn print_books(&self) { for book in &self.books { println!("{}, published in {}", book.title, book.year); } } // ANCHOR: Library_oldest_book //fn oldest_book(self) -> Option<&Book> { // todo!("Return a reference to the oldest book (if any)") //} // ANCHOR_END: Library_oldest_book fn oldest_book(&self) -> Option<&Book> { // Using a closure and a built-in method: // self.books.iter().min_by_key(|book| book.year) // Longer hand-written solution: let mut oldest: Option<&Book> = None; for book in self.books.iter() { if oldest.is_none() || book.year < oldest.unwrap().year { oldest = Some(book); } } oldest } } // ANCHOR: main // This shows the desired behavior. Uncomment the code below and // implement the missing methods. You will need to update the // method signatures, including the "self" parameter! You may // also need to update the variable bindings within main. fn main() { let library = Library::new(); //println!("A biblioteca estĂĄ vazia: biblioteca.esta_vazia() -> {}", biblioteca.esta_vazia()); // //biblioteca.adicionar_livro(Livro::new("Lord of the Rings", 1954)); //biblioteca.adicionar_livro(Livro::new("Alice's Adventures in Wonderland", 1865)); // //println!("The biblioteca nĂŁo estĂĄ mais vazia: biblioteca.esta_vazia() -> {}", biblioteca.esta_vazia()); // // //biblioteca.imprimir_livros(); // //match biblioteca.livro_mais_antigo() { // Some(livro) => println!("O livro mais antigo Ă© {}", livro.titulo), // None => println!("A biblioteca estĂĄ vazia!"), //} // //println!("The biblioteca tem {} livros", biblioteca.tamanho()); //biblioteca.imprimir_livros(); } // ANCHOR_END: main #[test] fn test_library_len() { let mut library = Library::new(); assert_eq!(library.len(), 0); assert!(library.is_empty()); library.add_book(Book::new("Lord of the Rings", 1954)); library.add_book(Book::new("Alice's Adventures in Wonderland", 1865)); assert_eq!(library.len(), 2); assert!(!library.is_empty()); } #[test] fn test_library_is_empty() { let mut library = Library::new(); assert!(library.is_empty()); library.add_book(Book::new("Lord of the Rings", 1954)); assert!(!library.is_empty()); } #[test] fn test_library_print_books() { let mut library = Library::new(); library.add_book(Book::new("Lord of the Rings", 1954)); library.add_book(Book::new("Alice's Adventures in Wonderland", 1865)); // We could try and capture stdout, but let us just call the // method to start with. library.print_books(); } #[test] fn test_library_oldest_book() { let mut library = Library::new(); assert!(library.oldest_book().is_none()); library.add_book(Book::new("Lord of the Rings", 1954)); assert_eq!( library.oldest_book().map(|b| b.title.as_str()), Some("Lord of the Rings") ); library.add_book(Book::new("Alice's Adventures in Wonderland", 1865)); assert_eq!( library.oldest_book().map(|b| b.title.as_str()), Some("Alice's Adventures in Wonderland") ); }
Dia 2 ExercĂcios da Tarde
Strings e Iteradores
// Copyright 2022 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. // ANCHOR: prefix_matches pub fn prefix_matches(prefix: &str, request_path: &str) -> bool { // ANCHOR_END: prefix_matches let mut request_segments = request_path.split('/'); for prefix_segment in prefix.split('/') { let Some(request_segment) = request_segments.next() else { return false; }; if request_segment != prefix_segment && prefix_segment != "*" { return false; } } true // Alternatively, Iterator::zip() lets us iterate simultaneously over prefix // and request segments. The zip() iterator is finished as soon as one of // the source iterators is finished, but we need to iterate over all request // segments. A neat trick that makes zip() work is to use map() and chain() // to produce an iterator that returns Some(str) for each pattern segments, // and then returns None indefinitely. } // ANCHOR: unit-tests #[test] fn test_matches_without_wildcard() { assert!(prefix_matches("/v1/editores", "/v1/editores")); assert!(prefix_matches("/v1/editores", "/v1/editores/abc-123")); assert!(prefix_matches("/v1/editores", "/v1/editores/abc/livros")); assert!(!prefix_matches("/v1/editores", "/v1")); assert!(!prefix_matches("/v1/editores", "/v1/editoresLivros")); assert!(!prefix_matches("/v1/editores", "/v1/pai/editores")); } #[test] fn test_matches_with_wildcard() { assert!(prefix_matches( "/v1/editores/*/livros", "/v1/editores/foo/livros" )); assert!(prefix_matches( "/v1/editores/*/livros", "/v1/editores/bar/livros" )); assert!(prefix_matches( "/v1/editores/*/livros", "/v1/editores/foo/livros/livro1" )); assert!(!prefix_matches("/v1/editores/*/livros", "/v1/editores")); assert!(!prefix_matches( "/v1/editores/*/livros", "/v1/editores/foo/livrosPorAutor" )); } // ANCHOR_END: unit-tests fn main() {}
Dia 3 ExercĂcio matinal
Uma Biblioteca GUI Simples
// Copyright 2022 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. // ANCHOR: setup pub trait Widget { /// Natural width of `self`. fn width(&self) -> usize; /// Draw the widget into a buffer. fn draw_into(&self, buffer: &mut dyn std::fmt::Write); /// Draw the widget on standard output. fn draw(&self) { let mut buffer = String::new(); self.draw_into(&mut buffer); println!("{buffer}"); } } pub struct Label { label: String, } impl Label { fn new(label: &str) -> Label { Label { label: label.to_owned(), } } } pub struct Button { label: Label, callback: Box<dyn FnMut()>, } impl Button { fn new(label: &str, callback: Box<dyn FnMut()>) -> Button { Button { label: Label::new(label), callback, } } } pub struct Window { title: String, widgets: Vec<Box<dyn Widget>>, } impl Window { fn new(title: &str) -> Window { Window { title: title.to_owned(), widgets: Vec::new(), } } fn add_widget(&mut self, widget: Box<dyn Widget>) { self.widgets.push(widget); } fn inner_width(&self) -> usize { std::cmp::max( self.title.chars().count(), self.widgets.iter().map(|w| w.width()).max().unwrap_or(0), ) } } // ANCHOR_END: setup // ANCHOR: Window-width impl Widget for Window { fn width(&self) -> usize { // ANCHOR_END: Window-width // Add 4 paddings for borders self.inner_width() + 4 } // ANCHOR: Window-draw_into fn draw_into(&self, buffer: &mut dyn std::fmt::Write) { // ANCHOR_END: Window-draw_into let mut inner = String::new(); for widget in &self.widgets { widget.draw_into(&mut inner); } let inner_width = self.inner_width(); // TODO: after learning about error handling, you can change // draw_into to return Result<(), std::fmt::Error>. Then use // the ?-operator here instead of .unwrap(). writeln!(buffer, "+-{:-<inner_width$}-+", "").unwrap(); writeln!(buffer, "| {:^inner_width$} |", &self.title).unwrap(); writeln!(buffer, "+={:=<inner_width$}=+", "").unwrap(); for line in inner.lines() { writeln!(buffer, "| {:inner_width$} |", line).unwrap(); } writeln!(buffer, "+-{:-<inner_width$}-+", "").unwrap(); } } // ANCHOR: Button-width impl Widget for Button { fn width(&self) -> usize { // ANCHOR_END: Button-width self.label.width() + 8 // add a bit of padding } // ANCHOR: Button-draw_into fn draw_into(&self, buffer: &mut dyn std::fmt::Write) { // ANCHOR_END: Button-draw_into let width = self.width(); let mut label = String::new(); self.label.draw_into(&mut label); writeln!(buffer, "+{:-<width$}+", "").unwrap(); for line in label.lines() { writeln!(buffer, "|{:^width$}|", &line).unwrap(); } writeln!(buffer, "+{:-<width$}+", "").unwrap(); } } // ANCHOR: Label-width impl Widget for Label { fn width(&self) -> usize { // ANCHOR_END: Label-width self.label .lines() .map(|line| line.chars().count()) .max() .unwrap_or(0) } // ANCHOR: Label-draw_into fn draw_into(&self, buffer: &mut dyn std::fmt::Write) { // ANCHOR_END: Label-draw_into writeln!(buffer, "{}", &self.label).unwrap(); } } // ANCHOR: main fn main() { let mut window = Window::new("Rust GUI Demo 1.23"); window.add_widget(Box::new(Label::new("This is a small text GUI demo."))); window.add_widget(Box::new(Button::new( "Click me!", Box::new(|| println!("You clicked the button!")), ))); window.draw(); } // ANCHOR_END: main
Pontos e PolĂgonos
// Copyright 2022 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. #[derive(Debug, Copy, Clone, PartialEq, Eq)] // ANCHOR: Point pub struct Point { // ANCHOR_END: Point x: i32, y: i32, } // ANCHOR: Point-impl impl Point { // ANCHOR_END: Point-impl pub fn new(x: i32, y: i32) -> Point { Point { x, y } } pub fn magnitude(self) -> f64 { f64::from(self.x.pow(2) + self.y.pow(2)).sqrt() } pub fn dist(self, other: Point) -> f64 { (self - other).magnitude() } } impl std::ops::Add for Point { type Output = Self; fn add(self, other: Self) -> Self::Output { Self { x: self.x + other.x, y: self.y + other.y, } } } impl std::ops::Sub for Point { type Output = Self; fn sub(self, other: Self) -> Self::Output { Self { x: self.x - other.x, y: self.y - other.y, } } } // ANCHOR: Polygon pub struct Polygon { // ANCHOR_END: Polygon points: Vec<Point>, } // ANCHOR: Polygon-impl impl Polygon { // ANCHOR_END: Polygon-impl pub fn new() -> Polygon { Polygon { points: Vec::new() } } pub fn add_point(&mut self, point: Point) { self.points.push(point); } pub fn left_most_point(&self) -> Option<Point> { self.points.iter().min_by_key(|p| p.x).copied() } pub fn iter(&self) -> impl Iterator<Item = &Point> { self.points.iter() } pub fn length(&self) -> f64 { if self.points.is_empty() { return 0.0; } let mut result = 0.0; let mut last_point = self.points[0]; for point in &self.points[1..] { result += last_point.dist(*point); last_point = *point; } result += last_point.dist(self.points[0]); result // Alternatively, Iterator::zip() lets us iterate over the points as pairs // but we need to pair each point with the next one, and the last point // with the first point. The zip() iterator is finished as soon as one of // the source iterators is finished, a neat trick is to combine Iterator::cycle // with Iterator::skip to create the second iterator for the zip and using map // and sum to calculate the total length. } } // ANCHOR: Circle pub struct Circle { // ANCHOR_END: Circle center: Point, radius: i32, } // ANCHOR: Circle-impl impl Circle { // ANCHOR_END: Circle-impl pub fn new(center: Point, radius: i32) -> Circle { Circle { center, radius } } pub fn circumference(&self) -> f64 { 2.0 * std::f64::consts::PI * f64::from(self.radius) } pub fn dist(&self, other: &Self) -> f64 { self.center.dist(other.center) } } // ANCHOR: Shape pub enum Shape { Polygon(Polygon), Circle(Circle), } // ANCHOR_END: Shape impl From<Polygon> for Shape { fn from(poly: Polygon) -> Self { Shape::Polygon(poly) } } impl From<Circle> for Shape { fn from(circle: Circle) -> Self { Shape::Circle(circle) } } impl Shape { pub fn perimeter(&self) -> f64 { match self { Shape::Polygon(poly) => poly.length(), Shape::Circle(circle) => circle.circumference(), } } } // ANCHOR: unit-tests #[cfg(test)] mod tests { use super::*; fn round_two_digits(x: f64) -> f64 { (x * 100.0).round() / 100.0 } #[test] fn test_point_magnitude() { let p1 = Point::new(12, 13); assert_eq!(round_two_digits(p1.magnitude()), 17.69); } #[test] fn test_point_dist() { let p1 = Point::new(10, 10); let p2 = Point::new(14, 13); assert_eq!(round_two_digits(p1.dist(p2)), 5.00); } #[test] fn test_point_add() { let p1 = Point::new(16, 16); let p2 = p1 + Point::new(-4, 3); assert_eq!(p2, Point::new(12, 19)); } #[test] fn test_polygon_left_most_point() { let p1 = Point::new(12, 13); let p2 = Point::new(16, 16); let mut poly = Polygon::new(); poly.add_point(p1); poly.add_point(p2); assert_eq!(poly.left_most_point(), Some(p1)); } #[test] fn test_polygon_iter() { let p1 = Point::new(12, 13); let p2 = Point::new(16, 16); let mut poly = Polygon::new(); poly.add_point(p1); poly.add_point(p2); let points = poly.iter().cloned().collect::<Vec<_>>(); assert_eq!(points, vec![Point::new(12, 13), Point::new(16, 16)]); } #[test] fn test_shape_perimeters() { let mut poly = Polygon::new(); poly.add_point(Point::new(12, 13)); poly.add_point(Point::new(17, 11)); poly.add_point(Point::new(16, 16)); let shapes = vec![ Shape::from(poly), Shape::from(Circle::new(Point::new(10, 20), 5)), ]; let perimeters = shapes .iter() .map(Shape::perimeter) .map(round_two_digits) .collect::<Vec<_>>(); assert_eq!(perimeters, vec![15.48, 31.42]); } } // ANCHOR_END: unit-tests fn main() {}
Dia 3 ExercĂcios da Tarde
Wrapper FFI seguro
// Copyright 2022 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. // ANCHOR: ffi mod ffi { use std::os::raw::{c_char, c_int}; #[cfg(not(target_os = "macos"))] use std::os::raw::{c_long, c_ulong, c_ushort, c_uchar}; // Tipo opaco. Veja https://doc.rust-lang.org/nomicon/ffi.html. #[repr(C)] pub struct DIR { _data: [u8; 0], _marker: core::marker::PhantomData<(*mut u8, core::marker::PhantomPinned)>, } // Layout de acordo com a pĂĄgina man do Linux para readdir(3), onde ino_t e // off_t sĂŁo resolvidos de acordo com as definiçÔes em // /usr/include/x86_64-linux-gnu/{sys/types.h, bits/typesizes.h}. #[cfg(not(target_os = "macos"))] #[repr(C)] pub struct dirent { pub d_ino: c_ulong, pub d_off: c_long, pub d_reclen: c_ushort, pub d_type: c_uchar, pub d_name: [c_char; 256], } // Layout de acordo com a pĂĄgina man do macOS man page para dir(5). #[cfg(all(target_os = "macos"))] #[repr(C)] pub struct dirent { pub d_fileno: u64, pub d_seekoff: u64, pub d_reclen: u16, pub d_namlen: u16, pub d_type: u8, pub d_name: [c_char; 1024], } extern "C" { pub fn opendir(s: *const c_char) -> *mut DIR; #[cfg(not(all(target_os = "macos", target_arch = "x86_64")))] pub fn readdir(s: *mut DIR) -> *const dirent; // Veja https://github.com/rust-lang/libc/issues/414 e a seção sobre // _DARWIN_FEATURE_64_BIT_INODE na pĂĄgina man do macOS para stat(2). // // "Plataformas que existiram antes destas atualizaçÔes estarem disponĂveis" refere-se // ao macOS (ao contrĂĄrio do iOS / wearOS / etc.) em Intel e PowerPC. #[cfg(all(target_os = "macos", target_arch = "x86_64"))] #[link_name = "readdir$INODE64"] pub fn readdir(s: *mut DIR) -> *const dirent; pub fn closedir(s: *mut DIR) -> c_int; } } use std::ffi::{CStr, CString, OsStr, OsString}; use std::os::unix::ffi::OsStrExt; #[derive(Debug)] struct DirectoryIterator { path: CString, dir: *mut ffi::DIR, } // ANCHOR_END: ffi // ANCHOR: DirectoryIterator impl DirectoryIterator { fn new(path: &str) -> Result<DirectoryIterator, String> { // Call opendir and return a Ok value if that worked, // otherwise return Err with a message. // ANCHOR_END: DirectoryIterator let path = CString::new(path).map_err(|err| format!("Invalid path: {err}"))?; // SAFETY: path.as_ptr() cannot be NULL. let dir = unsafe { ffi::opendir(path.as_ptr()) }; if dir.is_null() { Err(format!("Could not open {:?}", path)) } else { Ok(DirectoryIterator { path, dir }) } } } // ANCHOR: Iterator impl Iterator for DirectoryIterator { type Item = OsString; fn next(&mut self) -> Option<OsString> { // Keep calling readdir until we get a NULL pointer back. // ANCHOR_END: Iterator // SAFETY: self.dir is never NULL. let dirent = unsafe { ffi::readdir(self.dir) }; if dirent.is_null() { // We have reached the end of the directory. return None; } // SAFETY: dirent is not NULL and dirent.d_name is NUL // terminated. let d_name = unsafe { CStr::from_ptr((*dirent).d_name.as_ptr()) }; let os_str = OsStr::from_bytes(d_name.to_bytes()); Some(os_str.to_owned()) } } // ANCHOR: Drop impl Drop for DirectoryIterator { fn drop(&mut self) { // Call closedir as needed. // ANCHOR_END: Drop if !self.dir.is_null() { // SAFETY: self.dir is not NULL. if unsafe { ffi::closedir(self.dir) } != 0 { panic!("Could not close {:?}", self.path); } } } } // ANCHOR: main fn main() -> Result<(), String> { let iter = DirectoryIterator::new(".")?; println!("files: {:#?}", iter.collect::<Vec<_>>()); Ok(()) } // ANCHOR_END: main #[cfg(test)] mod tests { use super::*; use std::error::Error; #[test] fn test_nonexisting_directory() { let iter = DirectoryIterator::new("no-such-directory"); assert!(iter.is_err()); } #[test] fn test_empty_directory() -> Result<(), Box<dyn Error>> { let tmp = tempfile::TempDir::new()?; let iter = DirectoryIterator::new( tmp.path().to_str().ok_or("Non UTF-8 character in path")?, )?; let mut entries = iter.collect::<Vec<_>>(); entries.sort(); assert_eq!(entries, &[".", ".."]); Ok(()) } #[test] fn test_nonempty_directory() -> Result<(), Box<dyn Error>> { let tmp = tempfile::TempDir::new()?; std::fs::write(tmp.path().join("foo.txt"), "The Foo Diaries\n")?; std::fs::write(tmp.path().join("bar.png"), "<PNG>\n")?; std::fs::write(tmp.path().join("crab.rs"), "//! Crab\n")?; let iter = DirectoryIterator::new( tmp.path().to_str().ok_or("Non UTF-8 character in path")?, )?; let mut entries = iter.collect::<Vec<_>>(); entries.sort(); assert_eq!(entries, &[".", "..", "bar.png", "crab.rs", "foo.txt"]); Ok(()) } }
Bare Metal Rust Morning Exercise
BĂșssola
// Copyright 2023 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. // ANCHOR: top #![no_main] #![no_std] extern crate panic_halt as _; use core::fmt::Write; use cortex_m_rt::entry; // ANCHOR_END: top use core::cmp::{max, min}; use lsm303agr::{AccelOutputDataRate, Lsm303agr, MagOutputDataRate}; use microbit::display::blocking::Display; use microbit::hal::prelude::*; use microbit::hal::twim::Twim; use microbit::hal::uarte::{Baudrate, Parity, Uarte}; use microbit::hal::Timer; use microbit::pac::twim0::frequency::FREQUENCY_A; use microbit::Board; const COMPASS_SCALE: i32 = 30000; const ACCELEROMETER_SCALE: i32 = 700; // ANCHOR: main #[entry] fn main() -> ! { let board = Board::take().unwrap(); // Configure serial port. let mut serial = Uarte::new( board.UARTE0, board.uart.into(), Parity::EXCLUDED, Baudrate::BAUD115200, ); // Set up the I2C controller and Inertial Measurement Unit. // ANCHOR_END: main writeln!(serial, "Setting up IMU...").unwrap(); let i2c = Twim::new(board.TWIM0, board.i2c_internal.into(), FREQUENCY_A::K100); let mut imu = Lsm303agr::new_with_i2c(i2c); imu.init().unwrap(); imu.set_mag_odr(MagOutputDataRate::Hz50).unwrap(); imu.set_accel_odr(AccelOutputDataRate::Hz50).unwrap(); let mut imu = imu.into_mag_continuous().ok().unwrap(); // Set up display and timer. let mut timer = Timer::new(board.TIMER0); let mut display = Display::new(board.display_pins); let mut mode = Mode::Compass; let mut button_pressed = false; // ANCHOR: loop writeln!(serial, "Ready.").unwrap(); loop { // Read compass data and log it to the serial port. // ANCHOR_END: loop while !(imu.mag_status().unwrap().xyz_new_data && imu.accel_status().unwrap().xyz_new_data) {} let compass_reading = imu.mag_data().unwrap(); let accelerometer_reading = imu.accel_data().unwrap(); writeln!( serial, "{},{},{}\t{},{},{}", compass_reading.x, compass_reading.y, compass_reading.z, accelerometer_reading.x, accelerometer_reading.y, accelerometer_reading.z, ) .unwrap(); let mut image = [[0; 5]; 5]; let (x, y) = match mode { Mode::Compass => ( scale(-compass_reading.x, -COMPASS_SCALE, COMPASS_SCALE, 0, 4) as usize, scale(compass_reading.y, -COMPASS_SCALE, COMPASS_SCALE, 0, 4) as usize, ), Mode::Accelerometer => ( scale( accelerometer_reading.x, -ACCELEROMETER_SCALE, ACCELEROMETER_SCALE, 0, 4, ) as usize, scale( -accelerometer_reading.y, -ACCELEROMETER_SCALE, ACCELEROMETER_SCALE, 0, 4, ) as usize, ), }; image[y][x] = 255; display.show(&mut timer, image, 100); // If button A is pressed, switch to the next mode and briefly blink all LEDs on. if board.buttons.button_a.is_low().unwrap() { if !button_pressed { mode = mode.next(); display.show(&mut timer, [[255; 5]; 5], 200); } button_pressed = true; } else { button_pressed = false; } } } #[derive(Copy, Clone, Debug, Eq, PartialEq)] enum Mode { Compass, Accelerometer, } impl Mode { fn next(self) -> Self { match self { Self::Compass => Self::Accelerometer, Self::Accelerometer => Self::Compass, } } } fn scale(value: i32, min_in: i32, max_in: i32, min_out: i32, max_out: i32) -> i32 { let range_in = max_in - min_in; let range_out = max_out - min_out; cap( min_out + range_out * (value - min_in) / range_in, min_out, max_out, ) } fn cap(value: i32, min_value: i32, max_value: i32) -> i32 { max(min_value, min(value, max_value)) }
Bare Metal Rust Tarde
RTC driver
main.rs
:
// Copyright 2023 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. // ANCHOR: top #![no_main] #![no_std] mod exceptions; mod logger; mod pl011; // ANCHOR_END: top mod pl031; use crate::pl031::Rtc; use arm_gic::gicv3::{IntId, Trigger}; use arm_gic::{irq_enable, wfi}; use chrono::{TimeZone, Utc}; use core::hint::spin_loop; // ANCHOR: imports use crate::pl011::Uart; use arm_gic::gicv3::GicV3; use core::panic::PanicInfo; use log::{error, info, trace, LevelFilter}; use smccc::psci::system_off; use smccc::Hvc; /// Base addresses of the GICv3. const GICD_BASE_ADDRESS: *mut u64 = 0x800_0000 as _; const GICR_BASE_ADDRESS: *mut u64 = 0x80A_0000 as _; /// Base address of the primary PL011 UART. const PL011_BASE_ADDRESS: *mut u32 = 0x900_0000 as _; // ANCHOR_END: imports /// Base address of the PL031 RTC. const PL031_BASE_ADDRESS: *mut u32 = 0x901_0000 as _; /// The IRQ used by the PL031 RTC. const PL031_IRQ: IntId = IntId::spi(2); // ANCHOR: main #[no_mangle] extern "C" fn main(x0: u64, x1: u64, x2: u64, x3: u64) { // Safe because `PL011_BASE_ADDRESS` is the base address of a PL011 device, // and nothing else accesses that address range. let uart = unsafe { Uart::new(PL011_BASE_ADDRESS) }; logger::init(uart, LevelFilter::Trace).unwrap(); info!("main({:#x}, {:#x}, {:#x}, {:#x})", x0, x1, x2, x3); // Safe because `GICD_BASE_ADDRESS` and `GICR_BASE_ADDRESS` are the base // addresses of a GICv3 distributor and redistributor respectively, and // nothing else accesses those address ranges. let mut gic = unsafe { GicV3::new(GICD_BASE_ADDRESS, GICR_BASE_ADDRESS) }; gic.setup(); // ANCHOR_END: main // Safe because `PL031_BASE_ADDRESS` is the base address of a PL031 device, // and nothing else accesses that address range. let mut rtc = unsafe { Rtc::new(PL031_BASE_ADDRESS) }; let timestamp = rtc.read(); let time = Utc.timestamp_opt(timestamp.into(), 0).unwrap(); info!("RTC: {time}"); GicV3::set_priority_mask(0xff); gic.set_interrupt_priority(PL031_IRQ, 0x80); gic.set_trigger(PL031_IRQ, Trigger::Level); irq_enable(); gic.enable_interrupt(PL031_IRQ, true); // Wait for 3 seconds, without interrupts. let target = timestamp + 3; rtc.set_match(target); info!( "Waiting for {}", Utc.timestamp_opt(target.into(), 0).unwrap() ); trace!( "matched={}, interrupt_pending={}", rtc.matched(), rtc.interrupt_pending() ); while !rtc.matched() { spin_loop(); } trace!( "matched={}, interrupt_pending={}", rtc.matched(), rtc.interrupt_pending() ); info!("Finished waiting"); // Wait another 3 seconds for an interrupt. let target = timestamp + 6; info!( "Waiting for {}", Utc.timestamp_opt(target.into(), 0).unwrap() ); rtc.set_match(target); rtc.clear_interrupt(); rtc.enable_interrupt(true); trace!( "matched={}, interrupt_pending={}", rtc.matched(), rtc.interrupt_pending() ); while !rtc.interrupt_pending() { wfi(); } trace!( "matched={}, interrupt_pending={}", rtc.matched(), rtc.interrupt_pending() ); info!("Finished waiting"); // ANCHOR: main_end system_off::<Hvc>().unwrap(); } #[panic_handler] fn panic(info: &PanicInfo) -> ! { error!("{info}"); system_off::<Hvc>().unwrap(); loop {} } // ANCHOR_END: main_end
pl031.rs
:
#![allow(unused)] fn main() { // Copyright 2023 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. use core::ptr::{addr_of, addr_of_mut}; #[repr(C, align(4))] struct Registers { /// Data register dr: u32, /// Match register mr: u32, /// Load register lr: u32, /// Control register cr: u8, _reserved0: [u8; 3], /// Interrupt Mask Set or Clear register imsc: u8, _reserved1: [u8; 3], /// Raw Interrupt Status ris: u8, _reserved2: [u8; 3], /// Masked Interrupt Status mis: u8, _reserved3: [u8; 3], /// Interrupt Clear Register icr: u8, _reserved4: [u8; 3], } /// Driver for a PL031 real-time clock. #[derive(Debug)] pub struct Rtc { registers: *mut Registers, } impl Rtc { /// Constructs a new instance of the RTC driver for a PL031 device at the /// given base address. /// /// # Safety /// /// The given base address must point to the MMIO control registers of a /// PL031 device, which must be mapped into the address space of the process /// as device memory and not have any other aliases. pub unsafe fn new(base_address: *mut u32) -> Self { Self { registers: base_address as *mut Registers, } } /// Reads the current RTC value. pub fn read(&self) -> u32 { // Safe because we know that self.registers points to the control // registers of a PL031 device which is appropriately mapped. unsafe { addr_of!((*self.registers).dr).read_volatile() } } /// Writes a match value. When the RTC value matches this then an interrupt /// will be generated (if it is enabled). pub fn set_match(&mut self, value: u32) { // Safe because we know that self.registers points to the control // registers of a PL031 device which is appropriately mapped. unsafe { addr_of_mut!((*self.registers).mr).write_volatile(value) } } /// Returns whether the match register matches the RTC value, whether or not /// the interrupt is enabled. pub fn matched(&self) -> bool { // Safe because we know that self.registers points to the control // registers of a PL031 device which is appropriately mapped. let ris = unsafe { addr_of!((*self.registers).ris).read_volatile() }; (ris & 0x01) != 0 } /// Returns whether there is currently an interrupt pending. /// /// This should be true if and only if `matched` returns true and the /// interrupt is masked. pub fn interrupt_pending(&self) -> bool { // Safe because we know that self.registers points to the control // registers of a PL031 device which is appropriately mapped. let ris = unsafe { addr_of!((*self.registers).mis).read_volatile() }; (ris & 0x01) != 0 } /// Sets or clears the interrupt mask. /// /// When the mask is true the interrupt is enabled; when it is false the /// interrupt is disabled. pub fn enable_interrupt(&mut self, mask: bool) { let imsc = if mask { 0x01 } else { 0x00 }; // Safe because we know that self.registers points to the control // registers of a PL031 device which is appropriately mapped. unsafe { addr_of_mut!((*self.registers).imsc).write_volatile(imsc) } } /// Clears a pending interrupt, if any. pub fn clear_interrupt(&mut self) { // Safe because we know that self.registers points to the control // registers of a PL031 device which is appropriately mapped. unsafe { addr_of_mut!((*self.registers).icr).write_volatile(0x01) } } } // Safe because it just contains a pointer to device memory, which can be // accessed from any context. unsafe impl Send for Rtc {} }
Concurrency Morning Exercise
FilĂłsofos Jantando
// Copyright 2022 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. // ANCHOR: Philosopher use std::sync::{mpsc, Arc, Mutex}; use std::thread; use std::time::Duration; struct Fork; struct Philosopher { name: String, // ANCHOR_END: Philosopher left_fork: Arc<Mutex<Fork>>, right_fork: Arc<Mutex<Fork>>, thoughts: mpsc::SyncSender<String>, } // ANCHOR: Philosopher-think impl Philosopher { fn think(&self) { self.thoughts .send(format!("Eureka! {} has a new idea!", &self.name)) .unwrap(); } // ANCHOR_END: Philosopher-think // ANCHOR: Philosopher-eat fn eat(&self) { // ANCHOR_END: Philosopher-eat println!("{} is trying to eat", &self.name); let left = self.left_fork.lock().unwrap(); let right = self.right_fork.lock().unwrap(); // ANCHOR: Philosopher-eat-end println!("{} is eating...", &self.name); thread::sleep(Duration::from_millis(10)); } } static PHILOSOPHERS: &[&str] = &["Socrates", "Plato", "Aristotle", "Thales", "Pythagoras"]; fn main() { // ANCHOR_END: Philosopher-eat-end let (tx, rx) = mpsc::sync_channel(10); let forks = (0..PHILOSOPHERS.len()) .map(|_| Arc::new(Mutex::new(Fork))) .collect::<Vec<_>>(); for i in 0..forks.len() { let tx = tx.clone(); let mut left_fork = Arc::clone(&forks[i]); let mut right_fork = Arc::clone(&forks[(i + 1) % forks.len()]); // To avoid a deadlock, we have to break the symmetry // somewhere. This will swap the forks without deinitializing // either of them. if i == forks.len() - 1 { std::mem::swap(&mut left_fork, &mut right_fork); } let philosopher = Philosopher { name: PHILOSOPHERS[i].to_string(), thoughts: tx, left_fork, right_fork, }; thread::spawn(move || { for _ in 0..100 { philosopher.eat(); philosopher.think(); } }); } drop(tx); for thought in rx { println!("{thought}"); } }
Link Checker
// Copyright 2022 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. use std::{sync::Arc, sync::Mutex, sync::mpsc, thread}; // ANCHOR: setup use reqwest::{blocking::Client, Url}; use scraper::{Html, Selector}; use thiserror::Error; #[derive(Error, Debug)] enum Error { #[error("request error: {0}")] ReqwestError(#[from] reqwest::Error), #[error("bad http response: {0}")] BadResponse(String), } // ANCHOR_END: setup // ANCHOR: visit_page #[derive(Debug)] struct CrawlCommand { url: Url, extract_links: bool, } fn visit_page(client: &Client, command: &CrawlCommand) -> Result<Vec<Url>, Error> { println!("Checking {:#}", command.url); let response = client.get(command.url.clone()).send()?; if !response.status().is_success() { return Err(Error::BadResponse(response.status().to_string())); } let mut link_urls = Vec::new(); if !command.extract_links { return Ok(link_urls); } let base_url = response.url().to_owned(); let body_text = response.text()?; let document = Html::parse_document(&body_text); let selector = Selector::parse("a").unwrap(); let href_values = document .select(&selector) .filter_map(|element| element.value().attr("href")); for href in href_values { match base_url.join(href) { Ok(link_url) => { link_urls.push(link_url); } Err(err) => { println!("On {base_url:#}: ignored unparsable {href:?}: {err}"); } } } Ok(link_urls) } // ANCHOR_END: visit_page struct CrawlState { domain: String, visited_pages: std::collections::HashSet<String>, } impl CrawlState { fn new(start_url: &Url) -> CrawlState { let mut visited_pages = std::collections::HashSet::new(); visited_pages.insert(start_url.as_str().to_string()); CrawlState { domain: start_url.domain().unwrap().to_string(), visited_pages, } } /// Determine whether links within the given page should be extracted. fn should_extract_links(&self, url: &Url) -> bool { let Some(url_domain) = url.domain() else { return false; }; url_domain == self.domain } /// Mark the given page as visited, returning true if it had already /// been visited. fn mark_visited(&mut self, url: &Url) -> bool { self.visited_pages.insert(url.as_str().to_string()) } } type CrawlResult = Result<Vec<Url>, (Url, Error)>; fn spawn_crawler_threads( command_receiver: mpsc::Receiver<CrawlCommand>, result_sender: mpsc::Sender<CrawlResult>, thread_count: u32, ) { let command_receiver = Arc::new(Mutex::new(command_receiver)); for _ in 0..thread_count { let result_sender = result_sender.clone(); let command_receiver = command_receiver.clone(); thread::spawn(move || { let client = Client::new(); loop { let command_result = { let receiver_guard = command_receiver.lock().unwrap(); receiver_guard.recv() }; let Ok(crawl_command) = command_result else { // The sender got dropped. No more commands coming in. break; }; let crawl_result = match visit_page(&client, &crawl_command) { Ok(link_urls) => Ok(link_urls), Err(error) => Err((crawl_command.url, error)), }; result_sender.send(crawl_result).unwrap(); } }); } } fn control_crawl( start_url: Url, command_sender: mpsc::Sender<CrawlCommand>, result_receiver: mpsc::Receiver<CrawlResult>, ) -> Vec<Url> { let mut crawl_state = CrawlState::new(&start_url); let start_command = CrawlCommand { url: start_url, extract_links: true }; command_sender.send(start_command).unwrap(); let mut pending_urls = 1; let mut bad_urls = Vec::new(); while pending_urls > 0 { let crawl_result = result_receiver.recv().unwrap(); pending_urls -= 1; match crawl_result { Ok(link_urls) => { for url in link_urls { if crawl_state.mark_visited(&url) { let extract_links = crawl_state.should_extract_links(&url); let crawl_command = CrawlCommand { url, extract_links }; command_sender.send(crawl_command).unwrap(); pending_urls += 1; } } } Err((url, error)) => { bad_urls.push(url); println!("Got crawling error: {:#}", error); continue; } } } bad_urls } fn check_links(start_url: Url) -> Vec<Url> { let (result_sender, result_receiver) = mpsc::channel::<CrawlResult>(); let (command_sender, command_receiver) = mpsc::channel::<CrawlCommand>(); spawn_crawler_threads(command_receiver, result_sender, 16); control_crawl(start_url, command_sender, result_receiver) } fn main() { let start_url = reqwest::Url::parse("https://www.google.org").unwrap(); let bad_urls = check_links(start_url); println!("Bad URLs: {:#?}", bad_urls); }
Concurrency Afternoon Exercise
Dining Philosophers - Async
// Copyright 2023 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. // ANCHOR: Philosopher use std::sync::Arc; use tokio::time; use tokio::sync::mpsc::{self, Sender}; use tokio::sync::Mutex; struct Fork; struct Philosopher { name: String, // ANCHOR_END: Philosopher left_fork: Arc<Mutex<Fork>>, right_fork: Arc<Mutex<Fork>>, thoughts: Sender<String>, } // ANCHOR: Philosopher-think impl Philosopher { async fn think(&self) { self.thoughts .send(format!("Eureka! {} has a new idea!", &self.name)).await .unwrap(); } // ANCHOR_END: Philosopher-think // ANCHOR: Philosopher-eat async fn eat(&self) { // Pick up forks... // ANCHOR_END: Philosopher-eat let _first_lock = self.left_fork.lock().await; // Add a delay before picking the second fork to allow the execution // to transfer to another task time::sleep(time::Duration::from_millis(1)).await; let _second_lock = self.right_fork.lock().await; // ANCHOR: Philosopher-eat-body println!("{} is eating...", &self.name); time::sleep(time::Duration::from_millis(5)).await; // ANCHOR_END: Philosopher-eat-body // The locks are dropped here // ANCHOR: Philosopher-eat-end } } static PHILOSOPHERS: &[&str] = &["Socrates", "Plato", "Aristotle", "Thales", "Pythagoras"]; #[tokio::main] async fn main() { // ANCHOR_END: Philosopher-eat-end // Create forks let mut forks = vec![]; (0..PHILOSOPHERS.len()).for_each(|_| forks.push(Arc::new(Mutex::new(Fork)))); // Create philosophers let (philosophers, mut rx) = { let mut philosophers = vec![]; let (tx, rx) = mpsc::channel(10); for (i, name) in PHILOSOPHERS.iter().enumerate() { let left_fork = Arc::clone(&forks[i]); let right_fork = Arc::clone(&forks[(i + 1) % PHILOSOPHERS.len()]); // To avoid a deadlock, we have to break the symmetry // somewhere. This will swap the forks without deinitializing // either of them. if i == 0 { std::mem::swap(&mut left_fork, &mut right_fork); } philosophers.push(Philosopher { name: name.to_string(), left_fork, right_fork, thoughts: tx.clone(), }); } (philosophers, rx) // tx is dropped here, so we don't need to explicitly drop it later }; // Make them think and eat for phil in philosophers { tokio::spawn(async move { for _ in 0..100 { phil.think().await; phil.eat().await; } }); } // Output their thoughts while let Some(thought) = rx.recv().await { println!("Here is a thought: {thought}"); } }
Broadcast Chat Application
src/bin/server.rs
:
// Copyright 2023 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. // ANCHOR: setup use futures_util::sink::SinkExt; use std::error::Error; use std::net::SocketAddr; use tokio::net::{TcpListener, TcpStream}; use tokio::sync::broadcast::{channel, Sender}; use tokio_websockets::{Message, ServerBuilder, WebsocketStream}; // ANCHOR_END: setup // ANCHOR: handle_connection async fn handle_connection( addr: SocketAddr, mut ws_stream: WebsocketStream<TcpStream>, bcast_tx: Sender<String>, ) -> Result<(), Box<dyn Error + Send + Sync>> { // ANCHOR_END: handle_connection ws_stream .send(Message::text("Welcome to chat! Type a message".into())) .await?; let mut bcast_rx = bcast_tx.subscribe(); // A continuous loop for concurrently performing two tasks: (1) receiving // messages from `ws_stream` and broadcasting them, and (2) receiving // messages on `bcast_rx` and sending them to the client. loop { tokio::select! { incoming = ws_stream.next() => { match incoming { Some(Ok(msg)) => { let msg = msg.as_text()?; println!("From client {addr:?} {msg:?}"); bcast_tx.send(msg.into())?; } Some(Err(err)) => return Err(err.into()), None => return Ok(()), } } msg = bcast_rx.recv() => { ws_stream.send(Message::text(msg?)).await?; } } } // ANCHOR: main } #[tokio::main] async fn main() -> Result<(), Box<dyn Error + Send + Sync>> { let (bcast_tx, _) = channel(16); let listener = TcpListener::bind("127.0.0.1:2000").await?; println!("listening on port 2000"); loop { let (socket, addr) = listener.accept().await?; println!("New connection from {addr:?}"); let bcast_tx = bcast_tx.clone(); tokio::spawn(async move { // Wrap the raw TCP stream into a websocket. let ws_stream = ServerBuilder::new().accept(socket).await?; handle_connection(addr, ws_stream, bcast_tx).await }); } } // ANCHOR_END: main
src/bin/client.rs
:
// Copyright 2023 Google LLC // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. // ANCHOR: setup use futures_util::SinkExt; use http::Uri; use tokio::io::{AsyncBufReadExt, BufReader}; use tokio_websockets::{ClientBuilder, Message}; #[tokio::main] async fn main() -> Result<(), tokio_websockets::Error> { let mut ws_stream = ClientBuilder::from_uri(Uri::from_static("ws://127.0.0.1:2000")) .connect() .await?; let stdin = tokio::io::stdin(); let mut stdin = BufReader::new(stdin).lines(); // ANCHOR_END: setup // Continuous loop for concurrently sending and receiving messages. loop { tokio::select! { incoming = ws_stream.next() => { match incoming { Some(Ok(msg)) => println!("From server: {}", msg.as_text()?), Some(Err(err)) => return Err(err.into()), None => return Ok(()), } } res = stdin.next_line() => { match res { Ok(None) => return Ok(()), Ok(Some(line)) => ws_stream.send(Message::text(line.to_string())).await?, Err(err) => return Err(err.into()), } } } } }