(→Frühe Codeausführung vor main()) |
(→Daten zerlegen/zusammensetzen) |
||
Zeile 1.098: | Zeile 1.098: | ||
Oft benötigt wird der Zugriff auf die einzelnen Bytes eines <tt>int</tt>, also der Zugriff auf die Bytes eines 16-Bit-Wertes: | Oft benötigt wird der Zugriff auf die einzelnen Bytes eines <tt>int</tt>, also der Zugriff auf die Bytes eines 16-Bit-Wertes: | ||
− | + | ||
− | typedef union | + | typedef union |
− | { | + | { |
unsigned char asByte[2]; | unsigned char asByte[2]; | ||
unsigned short asWord; | unsigned short asWord; | ||
int asInt; | int asInt; | ||
− | } data16_t; | + | } data16_t; |
− | + | ||
− | data16_t data; | + | data16_t data; |
− | ... | + | ... |
− | + | int foo; | |
− | + | uint8_t wert; | |
− | + | ||
− | + | data.asInt = foo; | |
− | + | wert = data.asByte[1]; {{ccomment|die oberen 8 Bits von foo}} | |
− | + | ||
Ein komplexeres Beispiel, das noch mehr Datentypen überlagert: | Ein komplexeres Beispiel, das noch mehr Datentypen überlagert: | ||
− | + | typedef ... foo_t; | |
− | typedef ... foo_t; | + | |
− | + | typedef union | |
− | typedef union | + | { |
− | { | + | unsigned char byte[4]; {{ccomment| Zugriff als Bytes (8 Bit) }} |
− | + | unsigned short word[2]; {{ccomment| Zugriff als Words (16 Bit) }} | |
− | + | signed long slong; {{ccomment| Zugriff als signed long (32 Bit) }} | |
− | + | ||
− | + | struct {{ccomment| Zugriff auf einzelne Bitgruppen }} | |
− | + | { | |
− | + | unsigned bit_0_3 : 4; {{ccomment| 4 Bits (0..3) }} | |
− | + | unsigned bit_4_8 : 5; {{ccomment| 5 Bits (4..8) }} | |
− | + | unsigned bit_9_21 : 13; {{ccomment| 13 Bits (9..21) }} | |
− | + | unsigned bit_22_31: 10; {{ccomment| 10 Bits (22..31) }} | |
− | + | }; | |
− | + | ||
− | + | foo_t foo; {{ccomment| Zugriff als foo-Struktur }} | |
− | + | } data_t; | |
− | } data_t; | + | |
− | + | ... | |
− | ... | + | { |
− | { | + | data_t data; |
− | + | ||
− | + | data.byte[2] = 12; {{ccomment| setzt byte 2 auf 12 }} | |
− | + | data.bit_4_8 = 0x1f; {{ccomment| setzt bits 4..8 (5 Stück) alle auf 1 }} | |
− | + | ||
− | + | int anInt = data.foo.anInt; {{ccomment| liest ein Feld von foo (hier ein int) }} | |
− | + | ... | |
− | + | } | |
− | } | + | |
− | + | ||
===libgcc2 verwenden=== | ===libgcc2 verwenden=== |
Version vom 14. November 2006, 18:44 Uhr
avr-gcc ist ein freier C-Compiler, mit dem man C-Programme zu ausführbaren Programmen übersetzen kann, die auf Microcontrollern der AVR-Familie lauffähig sind. An Sprachen versteht avr-gcc sowohl C als auch C++. Neben Standard-C bzw. ANSI-C versteht avr-gcc auch GNU-C, das etwas mehr Möglichkeiten und kleinere Spracherweiterungen bietet.
avr-gcc kann auch dazu verwendet werden, um C/C++ Programme nach Assembler zu übersetzen oder um Bibliotheken zu erstellen, die später in unterschiedlichen Projekten verwendet werden können.
Wie bei allen aus der UNIX-Welt kommenden Programmen ist das Kommando-Interface von avr-gcc die Shell bzw. die Kommandozeile, über die Optionen, Parameter, Einstellungen und die Namen der zu übersetzenden Dateien angegeben werden.
Inhaltsverzeichnis
- 1 How to Read
- 2 Benutzer-Schnittstelle
- 3 Kommandozeilen-Optionen
- 4 Dynamische Speicherallokierung
- 5 C++
- 6 Code-Beispiele
- 7 Includes
- 8 Optimierungen, Tipps & Tricks
- 9 Inkompatibilität
- 10 Bugs
- 11 Abkürzungen und Bezeichnungen
- 12 Siehe auch
- 13 Weblinks
- 14 Autor
How to Read
Dieser Artikel bespricht avr-gcc Version 3.x. Er ist kein C-Tutorial und kein AVR-Handbuch – das würde den Umfang des Artikels bei weitem sprengen. Es gibt einen Unterartikel, der Interna von avr-gcc zusammenfasst.
Der Artikel ist ein Handbuch zu avr-gcc. Er bespricht zum Beispiel, wie man avr-gcc anwendet und Besonderheiten von avr-gcc-C, die nicht zum Sprachumfang von C gehören. Dazu zählen die Definition von Interrupt Service Routinen (ISRs) oder wie man Daten ins EEPROM legt.
Es wird also besprochen, wie eine ISR zu definieren ist, aber nicht, warum das gegebenenfalls notwendig oder nicht notwendig ist. Warum etwas gemacht wird, ist abhängig von der gestellten Aufgabe, etwa "Initialisiere den UART zur Benutzung mit 9600 Baud". Dafür enthält dieser Artikel zusammen mit dem AVR-Handbuch das Rüstzeug, bietet aber keine Lösungen für konkrete Aufgaben.
In den C-Codebeispielen befindet sich das ausführlichere Beispiel "Hallo Welt für AVR (LED blinken)", das nur eine LED blinkt und zeigt, wie ein kleines Projekt mit avr-gcc compiliert werden kann.
Es gibt ein C-Tutorial, das jedoch noch unvollständig und teilweise feherhaft ist (Stand 02/2006). Darüber hinaus gibt es ein C-Tutorial bei www.mikrocontroller.net.
Benutzer-Schnittstelle
Die Benutzer-Schnittstelle von avr-gcc ist – wie für alle Programme, die aus der UNIX-Welt kommen – die Kommandozeile einer Shell, Console bzw. Eingabeaufforderung.
Im einfachsten Fall sieht ein Aufruf von avr-gcc also so aus:
> avr-gcc
Dabei das '>' nicht mittippen, und ein ENTER am Ende der Zeile drücken. Die Antwort bei korrekter Installation ist dann
avr-gcc: no input files
Was bedeutet: das Programm avr-gcc wurde vom Betriebssystem gefunden und konnte/durfte gestartet werden. Dann gibt avr-gcc eine Fehlermeldung aus und beendet die Ausführung, weil er keine Eingabedatei(en) bekommen hat was ja auch stimmt. Soweit ist also alles in Butter.
Um eine C-Datei foo.c mir avr-gcc optimiert zu einem lauffähigen elf-Programm foo.elf für einen ATmega32 zu compileren, würde man angeben
> avr-gcc -O2 -mmcu=atmega32 foo.c -o foo.elf
Hat man seine Quellen auf zwei oder mehre Dateien verteilt, geht es analog:
> avr-gcc -O2 -mmcu=atmega32 foo.c foo2.c -o foo.elf
Will man nur eine Objekt-Datei erstellen (nur compilieren, nicht linken), dann geht das wie folgt. Das kann günstig sein bei grösseren Projekten, wenn man das Projekt neu erzeugen will, aber nur in einer Quelldatei was geändert hat. Oder wenn das Objekt in einer Bibliothek landen soll.
> avr-gcc -O2 -c -mmcu=atmega32 foo.c -o foo.o
Die ausführbare Gesamtdatei foo_all.elf erhält man dann, indem alle Objekte zusammenlinkt:
> avr-gcc -mmcu=atmega32 foo.o foo2.o foo3.o -o foo_all.elf
Um die ausführbare Datei in das oft verwendete Intex-HEX-Format umzuwandeln (einmal fürs Programm, einmal für ein Abbild des EEPROMs) gibt man an:
> avr-objcopy -O ihex -j .text -j .data foo_all.elf foo_all.hex > avr-objcopy -O ihex -j .eeprom --change-section-lma .eeprom=0 foo_all.elf foo_all_eeprom.hex
GCC war immer Kommandozeilen-orientiert und wird es auch immer bleiben, denn das hat gute Gründe:
- ein Compiler ist ein Compiler ist ein Compiler (und keine grafische Bedienschnittstelle)
- die Plattformabhängigkeit wird auf ein Minimum reduziert
- es gibt die Möglichkeit, avr-gcc per Skript oder make zu starten
- avr-gcc kann durchaus in eine Umgebung integriert werden: in einen Editor oder in eine GUI wie neuere Versionen von AVR-Studio erfolgreich beweisen, etc. Der avr-gcc-Aufruf kann sogar von einem Server-Socket oder einer Web-Application heraus erfolgen, welche ein C-Programm empfängt, es von avr-gcc übersetzen lässt, und das Resultat zurückschickt oder sonst was damit anstellt.
- Lizenzgründe: eine Umgebung, die avr-gcc integriert, kann durchaus proprietär oder nicht quelloffen sein und muss nicht der GPL unterliegen. Wieder ist AVR-Studio ein Beispiel.
Kommandozeilen-Optionen
Die Codegenerierung bei avr-gcc wird über Kommandozeilen-Optionen gesteuert. Diese legen fest, für welchen Controller Code zu erzeugen ist, wie stark optimiert wird, ob Debug-Informationen erzeugt werden, etc. Die Optionen teilen sich in zwei Gruppen: Optionen, die für alle GCC-Ports verfürgbar sind und maschinenspezifische Optionen, die nur für AVR verfügbar sind.
Aus der Masse an GCC-Optionen kann hier nur ein kleiner Auszug der wichtigsten und am häufigsten verwendeten Optionen vorgestellt werden. Eine Auflistung aller GCC-Optionen mit Kurzbeschreibung umfasst knapp 1000 Zeilen ohne undokumentierte Optionen, versteht sich.
Allgemeine Optionen für GCC
- --help
- Anzeige der wichtigsten Optionen
- --help -v
- Überschüttet einen mit Optionen
- --target-help
- Anzeige der wichtigsten maschinenspezifischen Optionen
- -O0
- keine Optimierung
- -O1
- Optimierung
- -Os
- optimiert für Code-Größe
- -O2
- stärkere Optimierung für bessere Laufzeit
- -g
- erzeugt Debug-Informationen
- -c
- (pre)compilert und assembliert nur bis zum Objekt (*.o), kein Link-Lauf
- -S
- (pre)compilert nur und erzeugt Assembler-Ausgabe (*.s)
- -E
- nur Precompilat (*.i) erzeugen, kein Compilieren, kein Assemblieren, kein Linken
- -o <filename>
- legt den Name der Ausgabedatei fest
- -v
- zeigt Versionsinformationen an und ist geschwätzig (verbose): Anzeige der aufgerufenen tools
- -I<path>
- Angabe eines weiteren Include-Pfads, in dem Dateien mit #include <...> gesucht werden
- -E -dM <filename>
- Anzeige aller Defines
- -MM
- Für die angegebenen Eingabe-Dateien wird eine Ausgabe erzeugt, die als Makefile-Fragment dienen kann und die Anhängigkeiten (dependencies) der Objekte von den Quellen/Headern beschreibt.
- -D<name>
- Definiert Makro <name>
- -D<name>=<wert>
- Definiert Makro <name> zu <wert>
- -U<name>
- Undefiniert Makro <name>
- -save-temps
- Temporäre Dateien (*.i, *.s) werden nicht gelöscht. Teilweise fehlerhaft zusammen mit -c
- -Wa,<options>
- übergibt Komma-getrennte Liste <options> an den Assembler (avr-as)
- -Wa,-a=<filename>
- Assembler erzeugt ein Listing mit Name <filename>
- -Wp,<options>
- übergibt Komma-getrennte Liste <options> an den Preprozessor
- -Wl,<options>
- übergibt Komma-getrennte Liste <options> an den Linker (avr-ld)
- -Wl,-Map=<filename>
- Linker erzeugt ein Map-File mit Name <filename>
- -Wl,--oformat=<format>
- Linker erzeugt Ausgabe im Format <format>, z.b. ihex für Intel-HEX-File
- -Wl,--section-start=<section>=<address>
- Linker legt die Section <section> ab Adresse <address>, z.B: .eeprom=0x810001
- -Wall
- gibt mehr Warnungen, aber immer noch nicht alle
- -pedantic
- geht besonders pedantisch mit Code um
- -std=c89
-ansi - bricht mit einer Fehlermeldung ab, wenn kein ANSI-C (ISO C89) verwendet wurde
- -std=c99
- bricht mit einer Fehlermeldung ab, wenn kein ISO C99 verwendet wurde
- -ffreestanding
- Das erzeugte Programm läuft nicht in einer Umgebung wie einer Shell. Der Prototyp von main ist
void main (void);
Maschinenspezifische Optionen für avr-gcc
Maschinenabhängige Optionen beginnen immer mit -m
- -mmcu=xxx
- Festlegen des Targets (Zielsystem/Controller), für das Code generiert werden soll. Je nach Target muss avr-gcc unterschiedliche Instruktionen verwendet und andere Startup-Dateien (crtxxx.o) einbinden. avr-gcc setzt spezielle Defines, um auch in der Quelle zwischen den Targets unterscheiden zu können, falls das notwendig sein sollte:
#ifdef __AVR_AT90S2313__ /* Code fuer AT90S2313 */ #elif defined (__AVR_ATmega8__) || defined (__AVR_ATmega32__) /* Code fuer Mega8 und Mega32 */ #else #error Das ist noch nicht implementiert für diesen Controller! #endif
Zwar gibt es für alle AVR-Derivate die avr/io.h, aber die AVR-Familien unterscheiden sich in ihrer Hardware; z.B. darin, wie I/O-Register heissen oder wie Hardware zu initialisieren ist. Diese Abhängigkeit kann man in unterschiedlichen Codestücken aufteilen und wie oben gezeigt bedingt übersetzen. Dadurch hat man Funktionalitäten wie uart_init auf unterschiedlichen Controllern und wahrt den Überblick, weil nicht für jede Controller-Familie eine extra Datei notwendig ist.
|
|
|
|
AVR, nur Assembler mcu Builtin define avr1 __AVR_ARCH__=1 at90s1200 __AVR_AT90S1200__ attiny11 __AVR_ATtiny11__ attiny12 __AVR_ATtiny12__ attiny15 __AVR_ATtiny15__ attiny28 __AVR_ATtiny28__
- -minit-stack=xxx
- Festlegen der Stack-Adresse
- -mint8
- Datentyp int ist nur 8 Bit breit, anstatt 16 Bit. Datentypen mit 32 Bit wie long sind nicht verfügbar
- -mno-interrupts
- Ändert den Stackpointer ohne Interrupts zu deaktivieren
- -mcall-prologues
- Funktions-Prolog und -Epilog werden als Unterroutinen umgesetzt, um die Codegröße zu verkleinern
- -mtiny-stack
- Nur die unteren 8 Bit des Stackpointers werden verändert
- -mno-tablejump
- Für ein switch-Statement werden keine Sprungtabellen angelegt
- -mshort-calls
- Verwendet rjmp/rcall (begrenzte Sprungweite) auf Devices mit mehr als 8 kByte Flash
- -msize
- Ausgabe der Instruktonslängen im asm-File
- -mdeb
- (undokumentiert) Ausgabe von Debug-Informationen für GCC-Entwickler
- -morder1
- (undokumentiert) andere Register-Allokierung
- -morder2
- (undokumentiert) andere Register-Allokierung
Dynamische Speicherallokierung
Zur dynamischen Speicherallokierung stehen Standard-Funktionen wie malloc zur Verfügung. Damit kann man zur Laufzeit Speicher anfordern und wenn man ihn nicht mehr benötigt, wieder freigeben. Funktionen wie malloc und calloc sind jedoch recht aufwändig. Die allokierten Speicherstücke werden intern in einer verketteten Liste verwaltet, und das verbraucht wertvollen Platz im Flash und im SRAM sowie Laufzeit.
Resourcen-schonendere Möglichkeiten, zur Laufzeit an Speicher zu kommen, bieteten __builtin_alloca und dynamische Arrays. Der Speicher, der damit belegt wird, wird nicht auf dem Heap angelegt, sondern im Frame der Funktion. Das ist wesentlich effektiver als die Standard-Methoden, denn es muss nur ein Wert zum Framepointer addiert werden. Den so erhaltenen Speicher braucht man auch nicht freizugeben. Das geschieht automatisch beim Verlassen der Funktion in deren Epilog, indem der Wert wieder vom Framepointer subtrahiert wird.
Von der Verwendung ist der mittels __builtin_alloca und dynamischer Arrays erhaltene Speicher also wie eine lokale Variable, mitsamt den bekannten Regeln für den Gültigkeitsbereich.
Insbesondere darf dieser Speicher nicht mit return an die darüberliegende Funktion zurückgegeben werden, weil er dann nicht mehr gültig ist und ein Zugriff darauf zu einem Laufzeitfehler führt!
Der Speicherbereich ist dort gültig, wo auch die Adresse einer 'normalen' lokalen Variablen gültig wäre, wenn diese an der gleichen Stelle definiert würde.
Das Programm/der Algorithmus muss daher beim Beschreiten dieses Wegs darauf angepasst sein.
Verwendung:
void function (size_t num_data) { /* data_t hat man irgendwo selber definiert, oder es ist ein elementarer Typ */ data_t * const p = (data_t * const) __builtin_alloca (num_data * sizeof (data_t)); /* Mach was mit p[0] ... p[num_data-1] */ ... }
oder mittels eines dynamischen Arrays:
void function (size_t num_data) { /* data_t hat man irgendwo selber definiert, oder es ist ein elementarer Typ */ data_t p[num_data]; /* Mach was mit p[0] ... p[num_data-1] */ ... }
C++
- "C++ is a complex language and an evolving one, and its standard definition (the ISO C++ standard) was only recently completed. As a result, your C++ compiler may occasionally surprise you, even when its behavior is correct."
Zudem sollte der Einsatz von C++ aus Effizienzgründen sehr kritisch betrachtet werden:
- "When programming C++ in space- and runtime-sensitive environments like microcontrollers, extra care should be taken to avoid unwanted side effects of the C++ calling conventions like implied copy constructors that could be called upon function invocation etc. These things could easily add up into a considerable amount of time and program memory wasted. Thus, casual inspection of the generated assembler code (using the -S compiler option) seems to be warranted."
Weiterhin unterliegt der Einsatz von C++ je nach Compiler/Lib-Version bestimmten Einschränkungen:
- Einer kompletten C++ Implementierung fehlt die Unterstützung durch die libstdc++, dadurch fehlen Standardfunktionen, -Klassen und -Templates
- Die Operatoren new und delete sind nicht implementiert, ihre Verwendung führt zu unauflösbaren externen Referenzen (Linker-Fehler)
- Nicht alle Header sind C++-sicher und müssen in extern "C" {...} eingeschlossen werden.
- Exceptions werden nicht unterstützt und müssen via -fno-exceptions abgeschaltet werden, oder der Linker beschwert sich über eine unauflösbare externe Referenz zu __gxx_personality_sj0.
Als Treiber verwendet man wie immer avr-gcc. Standard-Endungen für C++ sind .c++ und .cpp. Bei anderen Endungen teilt man mit -x c++ mit, daß es sich um C++ Dateien handelt, oder ruft avr-c++ direkt auf.
Interrupt-Service-Routinen (ISRs) sind C-Funktionen und werden definiert wie gehabt. Siehe auch Interrupts.
#include <avr/io.h> #include <avr/interrupt.h> #if defined (__cplusplus) extern "C" { #endif /* __cplusplus */ SIGNAL (SIG_NAME) { /* machwas */ } INTERRUPT (SIG_NAME) { /* mach was */ } #if defined (__cplusplus) } #endif /* __cplusplus */
__cplusplus ist ein Standard GCC-Builtin-Define.
Globale Konstruktoren werden in Section .init6 ausgeführt, die Destruktoren in .fini6.
Code-Beispiele
Dieser Abschnitt enthält Code-Schnippsel für avr-gcc. Es werden Besonderheiten besprochen, die für avr-gcc zu beachten sind.
Dieser Abschnitt ist kein Tutorial zur C-Programmierung und keine Einführung in die Programmiersprache C im allgemeinen. Dafür sei auf einschlägige Tutorials/Bücher verwiesen.
Zugriff auf Special Function Registers (SFRs)
Zugiff auf Bytes und Worte
For den Zugriff auf die SFRs gibt es Defines über den Include
#include <avr/io.h>
Abhängig vom eingestellten Controller werden denn Defines eingebunden, über die auf SFRs wie auf normale Variablen zugegriffen werden kann. Die Namen der Defines sind i.d.R. die gleichen wie im AVR-Manual, also z.b. SREG für das Prozessorstatus-Register SREG:
#include <avr/io.h> ... // SREG lesen uint8_t sreg = SREG; ... // SREG schreiben SREG = sreg;
Für einen Überblick über die eingebundenen Defines und kann ein Blick in den Controller-spezifischen Header hilfreich sein. Dieser befindet sich in
- <GCC_HOME>/avr/include/avr/io****.h
z.B. iom32.h für einen ATmega32.
Dieser Zugriff geht auch für 16-Bit Register wie TCNT1, für die eine bestimmte Reihenfolge für den Zugriff auf Low- und High-Teil eingehalten werden muss: avr-gcc generiert die Zugriffe in der richtigen Reihenfolge.
uint16_t tcnt1 = TCNT1;
Zu beachten ist, daß dieser Zugriff nicht atomar erfolgt. Das Lesen/Schreiben mehrbytiger Werte muss vom Compiler in mehrere Byte-Zugriffe zerlegt werden. Zwischen diesen Zugriffen kann ein Interrupt auftreten, wenn Interrupts aktiviert sind. Je nach Programm und welche Aufgaben eine ISR erledigt, kann dies zu Fehlfunktion führen. In dem Fall müssen diese Code-Stücke atomar gemacht werden, damit sie nicht durch einen IRQ unterbrochen werden können!
Zugriff auf einzelne Bits
Zugriff auf Bits geht wie gewohnt mit den Bitoperationen & (and), | (or), ^ (xor) und ~ (not)
Wieder gibt es Defines in den AVR-Headern, mit denen man Masken für den Zugriff erhalten kann, etwa:
/* GIMSK / GICR */ #define INT1 7 #define INT0 6 #define IVSEL 1 #define IVCE 0
Masken ergeben sich durch Schieben von 1 an die richtige Position:
// Ports B_0 und B_1 als Ausgang DDRB |= (1<<PB0) | (1<<PB1);
erzeugt
87 b3 in r24, 0x17 83 60 ori r24, 0x03 87 bb out 0x17, r24
Etwas anders sieht der Code aus, wenn die Bits einzeln gesetzt werden und das Register im bitadressierbaren Bereich liegt (SRAM 0x20 bis 0x3f resp. I/O 0x0 bis 0x1f):
// Ports B_0 und B_1 als Ausgang DDRB |= (1<<PB0); DDRB |= (1<<PB1);
erzeugt
b8 9a sbi 0x17, 0 b9 9a sbi 0x17, 1
Um Bits zu löschen, erzeugt man eine Maske, die an der betreffenden Stelle eine 0 hat:
// Ports B_2 als Eingang DDRB &= ~(1<<PB2);
Auch hier ist zu beachten, daß es Probleme geben kann, wenn nicht atomarer Code erzeugt wird, weil der AVR-Befehlssatz nicht mehr hergibt:
// toggle PORT B_0: wechseln 0 <--> 1 PORTB ^= (1<<PB0);
ergibt
88 b3 in r24, 0x18 ; Wenn hier ein Interrupt auftritt, in dessen ISR PORTB verändert wird, ; dann wird die Änderung durch die letzte Instruktion wieder überschrieben! 91 e0 ldi r25, 0x01 ; dito 89 27 eor r24, r25 ; dito 88 bb out 0x18, r24
Auch das Lesen einzelner Port-Pins geht über das Maskieren von SFRs:
DDRB &= ~(1 << PB2); // PortB.2 als INPUT if (PINB & (1 << PB2)) // PortB.2 ist HIGH else // PortB.2 ist LOW if (!(PINB & (1 << PB2))) // PortB.2 ist LOW else // PortB.2 ist HIGH
Interrupts
Um zu kennzeichnen, daß es sich bei einer Funktion um eine Interrupt Sevice Routine (ISR) handelt, gibt es spezielle Attribute. Diese brauchen nicht explizit hingeschrieben zu werden, ebensowenig wie die genaue Nummer des Interrupt Requests (IRQ). Dafür gibt es Includes und die folganeden Makros.
Bitte beachte auch die Hinweise zu den Inkompatibilitäten von avr-gcc!
#include <avr/io.h> #include <avr/signal.h> SIGNAL (SIG_OUTPUT_COMPARE1A) { /* ISR-Code */ } INTERRUPT (SIG_OUTPUT_COMPARE1B) { /* ISR-Code */ }
Dadurch wird die Funktion mit dem richtigen Prolog/Epilog erzeugt, und es wird ein Eintrag in die Interrupt-Vektortabelle gemacht bei obigem Beispiel also zwei Einträge.
Die Schreibweise des Signal-Names muss genau die sein wie im Header, das schliesst auch Leerzeichen ein! Nicht alle GCC-Versionen bringen Fehler/Warnung, wenn die Schreibweise nicht stimmt.
SIGNAL (SIG_OUTPUT_COMPARE1A ) // !!! Macht NICHT das, was man will (Blank am Ende)!!!
- SIGNAL
- Mit Ausführung einer ISR deaktiviert die AVR-Hardware die Interrupts, sodaß die ISR nicht durch andere Interrupt-Anforderungen unterbrochen wird. Beim Verlassen der ISR werden Interrupts wieder aktiviert. Tritt während der ISR ein IRQ auf, wird diese erst nach Beenden des ISR-Codes ausgeführt. Der Interrupt geht also nicht verloren. Zwischen zwei ISRs wird zusätzlich mindestens ein Befehl des normalen Programm-Codes abgearbeitet.
- INTERRUPT
- Früh im ISR-Prolog werden mit sei die von der AVR-Hardware temporär deaktivierten Interrupts reaktiviert. Dadurch kann die ISR von einer IRQ unterbrochen werden. Das bietet die Möglichkeit, so etwas wie Interrupt-Priorisierung nachzubilden, was AVRs selbst nicht können. Weiterhin kann man schneller auf bestimmte Ereignisse reagieren. Tritt während der ISR ein anderer IRQ auf, der schnell bedient werden muss, kann sofort der dringende ISR-Code ausgeführt werden. Ansonsten (Verwendung von SIGNAL) würde der Code erst ausgeführt werden, nachdem die aktuelle ISR beendet ist.
Dauert die ISR zu lange und wird sie nochmals von ihrem eigenen IRQ unterbrochen, stürzt man ab.
Nachschlagen kann man den Namen in
- <GCC_HOME>/avr/include/avr/ioxxxx.h
Interrupts aktivieren
Damit eine ISR überhaupt zur Ausführung kommt, müssen drei Bedingungen erfüllt sein
- Interrupts müssen global aktiviert sein
- Der entsprechen IRQ muss aktiviert worden sein
- Das zum IRQ gehörende Ereignis muss eintreten
#include <avr/io.h> #include <avr/interrupt.h> ... // enable OutputCompareA Interrupt für Timer1 TIMSK |= (1 << OCIE1A); // disable OutputCompareA Interrupt für Timer1 TIMSK &= ~(1 << OCIE1A); // Interrupts aktivieren sei(); // Interrupts abschalten cli();
Sperrt man eine Code-Sequenz durch Einschachteln in ein cli/sei Paar (man macht das Codestück "atomar", also ununterbrechbar), gehen währenddessen keine Interrupt-Anforderungen verloren. Die entsprechenden IRQ-Flags bleiben gesetzt, und nach dem sei werden die IRQs in der Reihenfolge ihrer Prioritäten abgearbeitet. Ausnahme ist, wenn in einem atomaren Block der selbe IRQ mehrfach auftritt. Der ISR-Code wird dann trotzdem nur einmal ausgeführt.
default Interrupt
Für nicht implementierte Interrupts macht avr-gcc in die Vektortabelle einen Eintrag, der zu __bad_interrupt (definiert im Startup-Code crt*.o) springt und von dort aus weiter zu Adresse 0. Dadurch läuft der AVR wieder von neuem los, wenn ein Interrupt auftritt, zu dem man keine ISR definiert hat allerdings ohne die Hardware zurückzusetzen wie bei einem echten Reset.
Möchte man diesen Fall abfangen, dann geht das über eine globale Funktion namens __vector_default:
#include <avr/interrupt.h> SIGNAL (__vector_default) ...
Damit wird von __bad_interrupt aus nicht nach Adresse 0 gesprungen, sondern weiter zu __vector_default, welches durch SIGNAL oder INTERRUPT den üblichen ISR-Prolog/Epilog bekommt.
So kann man z.B. eine Meldung ausgeben, eine Warnlampe blinken, in einer Endlosschleife landen, oder über den Watchdog einen richtigen Hardware-Reset auslösen, siehe auch Abschnitt "Reset auslösen".
ISR mit eigenem Prolog/Epilog
Wenn man in einer ISR komplett eigenes Zeug machen will, dann definiert man eine nackte Funktion. Mit naked befreit man die Routine vom Standard-Prolog/Epilog.
Dabei ist darauf zu achten, daß die ISR mit reti (return from interrupt) zurückkehrt und evtl. verwendete Register und den Status (SREG) sichert.
#include <avr/io.h> void __attribute__ ((naked)) SIG_OVERFLOW0 (void) { /* Port B.6 = 0 */ /* Diese Instruktion verändert nicht das SREG und kein anderes Register */ /* so daß der eigentliche Code nur 1 Befehl lang ist */ __asm__ __volatile ( "cbi %0, %1" "\n\t" "reti" : : "M" (_SFR_IO_ADDR (PORTB)), "i" (6) ); }
Die ISR sieht dann so aus:
__vector_9: c6 98 cbi 0x18, 6 18 95 reti
Wiederum kann man als Funktionsname __vector_default nehmen, um nicht-implementierte IRQs abzufangen:
void __attribute__ ((naked)) __vector_default (void) ...
SRAM, Flash, EEPROM: Datenablage am Beispiel Strings
Die Programmiersprache C kennt selber keine Strings; das einzige, was C bekannt ist, ist der Datentyp char, der ein einzelnes Zeichen repräsentiert.
Darstellung in C
Ein String im Sinne von C ist ein Array von Charactern bzw. ein Zeiger auf den Anfang des Arrays. Die einzelnen Zeichen folgen im Speicher direkt aufeinander und werden in aufsteigenden Adressen gespeichert. Am String-Ende folgt als Abschluss der Character '\0', um das Ende zu kennzeichnen. Dies ist besonders bei der Berechnung des Speicherplatzes für Strings zu berücksichtigen, denn für die 0 muss auch Platz reserviert werden.
Bestimmen der Stringlänge
/* Bestimmt die Laenge des Strings ohne die abschliessende '\0' zu zaehlen */ unsigned int strlength (const char *str) { unsigned int len = 0; while (*str++) len++; return len; }
Die Stringlänge kann auch mit der Standard-Funktion strlen bestimmt werden, deren Prototyp sich in string.h befindet:
#include <string.h> size_t strlen (const char*);
String im Flash belassen
Oftmals werden Strings nur zu Ausgabezwecken verwendet und nicht verändert. Verwendet man Sequenzen der Gestalt
char *str1 = "Hallo Welt!"; char str2[] = "Hallo Welt!";
dann werden die Strings im SRAM abgelegt. Im Startup-Code werden die Strings vom Flash ins SRAM kopiert und belegen daher sowohl Platz im SRAM als auch im Flash. Wird ein String nicht verändert, braucht er nicht ins SRAM kopiert zu werden. Das spart Platz im knapp bemessenen SRAM. Allerdings muss anders auf den String zugegriffen werden, denn wegen der Harvard-Architektur des AVR-Kerns kann avr-gcc anhand der Adresse nicht unterscheiden, ob diese ins SRAM, ins Flash oder ins EEPROM zeigt.
#include <avr/pgmspace.h> const prog_char str3[] = "Hallo Welt!"; unsigned int strlen_P (const prog_char *str) { unsigned int len = 0; while (1) { char c = (char) pgm_read_byte (str); if ('\0' == c) return len; len++; str++; } } void foo() { unsigned int len; len = strlen_P (str3); len = strlen_P (PSTR("String im Flash")); }
String ins EEPROM legen
Dies geht nach dem gleichen Muster, nach dem Strings ins Flash gelegt werden. Der Zugriff wird vergleichsweise langsam, denn der EEPROM ist langsamer als SRAM bzw. Flash.
#include <avr/eeprom.h> const char str4[] __attribute__ ((section(".eeprom"))) = "Hallo Welt!"; unsigned int strlen_EE (const char *str) { unsigned int len = 0; while (1) { char c = (char) eeprom_read_byte (str); if ('\0' == c) return len; len++; str++; } }
Reset auslösen
Falls ein Reset per Software ausgelöst werden soll, dann geht das am besten über den Watchdog. Einfach nur an den RESET-Punkt an Adresse 0 zu springen mit
goto *((void**) 0);
initialisiert zwar den Controller von neuem, aber es macht keinen wirkliches RESET mit Zurücksetzen der Hardware und allen I/O-Registern.
Durch den Watchdog kann man ein 'richtiges' RESET-Signal erzeugen lassen, so daß die AVR-Hardware genau so initialisiert ist, wie nach einem externen RESET. So kann man z.B. via UART ein RESET-Kommando schicken. Allerdings lässt sich der Watchdog nur minimal auf 15ms einstellen:
#include <avr/wdt.h> #include <avr/interrupt.h> ... cli(); // Interrupts global abschalten wdt_enable (WDTO_15MS); // Watchdog aufziehen auf 15ms while (1); // warten, bis er zubeisst...
Welches Ereignis einen RESET ausgelöst hat, kann man im Register MCUCSR (MCU Control and Status Register) erfahren. Es gibt 4 mögliche RESET-Quellen:
- Power-On Reset
- External Reset
- Brown-Out Reset
- Watchdog Reset
Soll der Inhalt von Variablen einen Reset überleben – eine Variable also nicht initialisiert werden – dann geht das so:
#include <avr/io.h> // status informiert z.B. darüber, ob wir selber den Watchdog ausgelöst haben // oder nicht, oder andere Informationen unsigned char status __attribute__ ((section (".noinit"))); void main (void) { // Wert von MCUSCR merken, möglichst früh im Programm unsigned char mcucsr = MCUCSR; // MCUCSR zurücksetzen MCUCSR = 0; // Watchdog-Reset if (mcuscr & (1 << WDRF)) { // status auswerten } // Power-On Reset: status auf definierten Wert setzen if (mcuscr & (1 << PORF)) { status = 0; } // status auswerten ... }
Frühe Codeausführung vor main()
Mitunter ist es notwendig, Code unmittelbar nach dem Reset auszuführen, noch bevor man in main() mit der eigentlichen Programmausführung beginnt. Das kann zB. zur Bedienung eines Watchdog-Timers erforderlich sein.
Nach einen Reset und vor Aufruf von main werden Initialisierungen ausgeführt wie
- Setzen des Stackpointers
- Vorbelegung globaler Datenobjekte: Daten ohne Initializer werden zu 0 initialisert (Section .bss). Für Daten mit Initializer (Section .data) werden die Werte aus dem Flash ins SRAM kopiert.
- Initialisierung von Registern wie R1, in dem bei avr-gcc immer die Konstante 0 gehalten wird.
Im Linker-Script werden Sections von .init0 bis .init9 definiert, die nacheinander abgearbeitet werden. Erst danach wird main betreten. Um Code früh auszuführen, legt man die Funktion in eine dieser Sections:
void code_init3() __attribute__ ((naked, section (".init3"))); /* !!! never call this function !!! */ void code_init3 (void) { /* Code */ }
Der Code in den .initn-Sections wird sequenziell ausgeführt, daher darf in diese Sections nur der nackte Funktions-Code, ohne Prolog und ohne Epilog (also auch ohne ret-Instruktion!). Da disee nackten Funktionen kein ret haben, dürfen sie nicht explizit aufgerufen werden! Ihr Aufruf erfolgt implizit dadurch, daß ihr Code in einer init-Section steht.
Zu beachten ist dabei
- Eine so definierte Funktion darf keinesfalls aufgerufen werden!
- Zuweisungen wie i=0; ergeben vor .init3 inkorrekten Code, da vor Ende von .init2 Register R1 noch nicht mit 0 besetzt ist, avr-gcc aber davon ausgeht, daß es eben diesen Wert enthält.
- Lokale Variablen müssen in Registern liegen, denn vor Ende von .init2 ist der Stackpointer noch nicht initialisiert. Zudem ist die Funktion naked, hat also insbesondere keinen Prolog, der den Framepointer (Y-Register) setzen könnte, falls er benötigt wird.
- Gegebenenfalls ist daher die Verwendung von inline-Assembler angezeigt oder die Implementierung in einem eigenen Assembler-Modul, das dazu gelinkt wird. Der erzeugte Code ist im List-File zu überprüfen.
- Werden mehrere Funktionen in die selbe init-Section gelegt, ist die Reihenfolge ihrer Ausführung nicht spezifiziert und i.a. nicht die gleiche wie in der Quelle.
Unbenutzte init-Sections haben die Nummern 0, 1, 3 und 5 bis 8. Die verbleibenden werden vom Startup-Code verwendet:
- .init2
- Initialisieren von R1 mit 0 und setzen des Stackpointers
- .init4
- Kopieren der Daten vom Flash ins SRAM (.data) und löschen von .bss
- .init6
- C++ Konstruktoren
- .init9
- Sprung zu main
Ein Programmbeispiel für Code in einer init-Section ist in "Speicherverbrauch bestimmen mit avr-gcc".
Includes
Die mit
#include <...>
angegebenen Includes werden von avr-gcc in den mit der Option '-I' anegegenen Pfaden gesucht. Dem Compiler bekannt sind die Pfade
<GCC_HOME>/avr/include Standard (stdio.h, ...) <GCC_HOME>/avr/include/avr AVR-spezifisch (avr/io.h, ...) <GCC_HOME>/lib/gcc/avr/<GCC_VERSION>/include Standard, compilerabh. (limits.h, ...)
Gibt man z.B. an
#include <stdio.h>
dann wird automatisch in diesem Verzeichnis nach stdio.h gesucht. In den Verzeichnissen stehen Standard-Includes, die benötigt werden, wenn man libc-Funktionen oder mathematische Funktionen etc. verwendet. AVR-spezifische Dinge stehen im Unterverzeichnis avr, etwa:
#include <avr/io.h>
Als Pfad-Separator wird immer ein / verwendet, auch auf Windows-Betriebssystemen! Also kein \ !
Standard
ctype.h Zeichen-Umwandlungs-Makros und ctype Makros errno.h Symbolische Namen für Fehlercodes inttypes.h Definiert [u]intN_t wenn man genau N [un]signed Bits braucht, ISO C99. math.h Mathematische Funktionen: sin, cos, log, gamma, bessel, ... setjmp.h libc unterstützt setjmp() und longjmp(), um direkt in eine andere (nicht-lokale) Funktion zu springen. stdio.h Standard I/O-Funktionen (printf, ...). stdlib.h Deklariert grundlegende ISO C-Makros und -Funktionen sowie einige AVR-spezifische Erweiterungen string.h Stringoperationen auf NULL-terminierten Strings. (strlen, ...) stdarg.h Funktionen mit variabler Argumenanzahl limits.h Min- und Max-Werte von Skalaren (UCHAR_MAX, LONG_MIN, ...)
AVR-spezifisch
Die AVR-spezifischen Includes finden sich wie gesagt im Unterverzeichnis avr. Die meisten dort befindlichen Header wird man nie direkt durch Angabe im C-File erhalten, sondern durch Angabe von
#include <avr/io.h>
Dadurch werden z.B. genau die I/O-Header eingebunden, die zum AVR-Modell passen, also
- avr/iom8.h für ATmega8,
- avr/iotn2313.h für ATtiny2313,
- avr/io2313.h für AT90S2313, etc.
Verantwortlich dafür ist der Schalter '-mmcu=xxx'.
Obwohl diese Header nicht explizit angegeben werden müssen, kann ein Blick dorthin hilfreich sein, um die Namen von SFRs oder Signals nachzuschlagen. Diese Header werden im folgenden nicht alle einzeln aufgelistet. Ihre Namen sind immer avr/io*.h.
- für ATmega: avr/iom*.h
- für ATtiny: avr/iotn*.h
avr/boot.h Bootloader Support avr/crc16.h [*] Prüfsumme CRC16 avr/delay.h [*] Verzögerungsschleifen für kurze, exakte Verzögerungen avr/eeprom.h EEPROM-Routinen avr/ina90.h Kompatibilität mit IAR-AVR-Compiler avr/interrupt.h sei(), cli(), ... avr/io.h --> inttypes.h, io*.h avr/io*.h SFRs, SIG_****, SPM_PAGESIZE, RAMEND, XRAMEND, E2END, FLASHEND avr/parity.h [*] Parität avr/pgmspace.h Zugriff aufs Flash: Byte lesen, PROGMEM, prog_char, prog_uint8_t, ... avr/portpins.h Makros für Port-Pins avr/signal.h [**] Makros SIGNAL() und INTERRUPT(), ... avr/sleep.h Power-Safe avr/twi.h [*] I2C avr/wdt.h Watchdog util/crc16.h Prüfsumme CRC16 util/delay.h Verzögerungsschleifen für kurze, exakte Verzögerungen util/parity.h Parität util/twi.h I2C [*] bei neueren avr-gcc-Versionen in util [**] entfällt bei neueren avr-gcc-Versionen. Stattdessen avr/interrupt.h verwenden
Anwendungs-spezifisch
Eigene Header, die nur innerhalb eigener Projekte gebraucht werden, includet man mit
#include "..."
Auch hier darf man Unterverzeichnisse angeben oder ins übergeordnete Verzeichnis:
#include "../../mein-zeug.h"
Optimierungen, Tipps & Tricks
Beim Programmieren in C möchte man sich möglichst wenig mit der Codeerzeugung selbst auseinandersetzen. Man verwendet ja gerade deshalb einen Compiler und programmiert nicht in Assembler, weil man sich nicht um Register-Belegungen o.ä. kümmern will, sondern nur um die zu lösende Aufgabe.
GCC erzeugt zwar recht guten Code, aber er ist nicht perfekt. Gerade auf Systemen wie AVR mit nur sehr begrenzten Resourcen muss man daher dem Compiler hilfreich zur Seite stehen, wenn man noch dichteren/schnelleren Code erhalten möchte.
- "Unlike most other C compilers, GCC allows you to use -g with -O. The shortcuts taken by optimized code may occasionally produce surprising results: some variables you declared may not exist at all; flow of control may briefly move where you did not expect it; some statements may not be executed because they compute constant results or their values were already at hand; some statements may execute in different places because they were moved out of loops.
- Nevertheless it proves possible to debug optimized output. This makes it reasonable to use the optimizer for programs that might have bugs."
Um das Ergebnis zu beurteilen, hilft ein Blick ins Listfile. Siehe dazu auch die Abschnitte "Listfile erstellen" und "Die Größe ermitteln" im Hallo Welt für AVR.
Optimierungsgrad
Als Optimierungsgrad erweist sich -Os (Optimize for Size) als der beste, evtl. noch -O2. Ohne Angabe eines Optimierungsgrades wird nicht optimiert, was gleichbedeutend mit der Option -O0 ist. Abzuraten ist von der maximalen Optimierung -O3, die wegen function inlining und loop unrolling zu sehr breitem Code führt und für AVR absolut nicht angesagt ist.
Vermeide printf, scanf, malloc
Funktionen von diesem Kaliber sind die absoluten Platz- und Zeitfresser.
Alternativen findet man reichlich in der avr-libc wie itoa und atoi. Und für malloc und Konsorten sind dynamische Arrays und das Compiler-Builtin __builtin_alloca effizientere Alternativen, siehe auch im Abschnitt "Dynamische Speicherallokierung".
Konstante Strings ins Flash
Konstante Strings, wie sie zu Ausgabezwecken Verwendung finden, werden im Programm oft nicht verändert und brauchen nicht SRAM zu belegen (und damit auch Flash, von wo aus sie vom Startup-Code ins SRAM kopiert werden), sondern gehören ins Flash!
Entsprechende Routinen, um auf Strings im Flash zuzugreifen, tragen die Suffix _P, wie z.B. strcmp_P mit dem Prototyp
extern int *strcmp_P (char *, const prog_char *)
Die Implementierungen befinden sich in der avr-libc.
Anwendung:
#include <avr/pgmspace.h> const prog_char str_p[] = "Ein String im Flash"; const char str2_p[] PROGMEM = "Noch ein String im Flash"; ... // String im SRAM mit String im Flash vergleichen if (!strcmp_P (str_sram, str_p)) { // mach was bei Gleichheit } // "foo" wird im RAM angelegt. Ineffizient für konstante Strings! // Beachte, daß damit strcmp (nicht strcmp_P) benutzt werden muss. if (!strcmp (str_sram, "foo")) { // mach was bei Gleichheit } // PSTR bewirkt, daß die String-Konstante "foo" // im Flash angelegt wird if (!strcmp_P (str_sram, PSTR ("foo")) { // mach was bei Gleichheit } ... }
Sprungtabelle
Genauso macht man auch eine Sprungtabelle, um anhand von Kommando-Strings dazugehörige Funktionen ausführen zu lassen:
#include <avr/pgmspace.h> int func1 (int arg) { ... } #define TEXT_LEN 15 // Die Kommandostruktur typedef struct { int (*func)(int); // Zeiger auf die auszuführende Funktion int arg; // das Argument, das mitübergeben wird char text[1+TEXT_LEN]; // Text, maximal TEXT_LEN Zeichen lang } command_t; // Das Array mit den Kommandos. // Die funcx sind vom Prototyp (z.B. func1 oben) // int funcx (int arg); const command_t commands[] PROGMEM = { { func1, 0, "Befehl 1" }, { func2, 3, "Befehl für func2" } }; // Sucht in commands[] nach text und führt gegebenenfalls // die dazugehörige Funktion funcx mit Argument arg aus. // Liefert den Rückgabewert von funcx // oder -1, falls text nicht gefunden wurde. int execute (const char *text) { // Schleifenvariable unsigned char i; // Wandert durch das Array mit Kommando-Strukturen const command_t * cmd = commands; // sizeof wird von gcc ausgewertet und ist wie eine Konstante, // denn beide sizeofs sind zur Compilezeit bekannt for (i=0; i < sizeof(commands) / sizeof(command_t); i++) { // Ist das der gesuchte String? if (strcmp_P (text, cmd->text)) { // Nein, dann weitersuchen cmd++; continue; } // Ja int (*func)(int), arg; // Dann Funktionszeiger und Argument besorgen, func = (int(*)(int)) pgm_read_word (& cmd->func); arg = (int) pgm_read_word (& cmd->arg); // Funktion ausführen und deren Wert zurückliefern return func (arg); } // text ist nicht in commands return -1; }
Nachteil dabei ist, daß jeder String den maximalen Platz von TEXT_LEN+1 Zeichen belegt. Falls man da noch weiter sparen will, dann kann man die Strings wieder ins Flash legen und ihre Adresse in der Struktur merken. Dadurch belegt ein String nur noch Länge+3 Zeichen (+3 wegen 1 Endezeichen und 2 Bytes für seine in der Struktur gemerkte Adresse). Die Definition der Tabelle wird aber umständlicher, weil jeder String einzeln angegeben werden muss:
#include <avr/pgmspace.h> // Die Kommandostruktur typedef struct { ... char * text; // Zeiger auf Text } command_t; const prog_char str_1[] = "Befehl 1"; const prog_char str_2[] = "Befehl für func2"; const command_t commands[] PROGMEM = { { func1, 0, str_1 }, { func2, 3, str_2 } }; // Sucht in commands[] nach text und führt gegebenenfalls // die dazugehörige Funktion funcx mit Argument arg aus. // Liefert den Rückgabewert von funcx // oder -1, falls text nicht gefunden wurde. int execute (const char *text) { // Schleifenvariable unsigned char i; // Wandert durch das Array mit Kommando-Strukturen const command_t * cmd = commands; // sizeof wird von gcc ausgewertet und ist wie eine Konstante, // denn beide sizeofs sind zur Compilezeit bekannt for (i=0; i < sizeof(commands) / sizeof (command_t); i++) { const prog_char * text_P; // Liest die Startadresse von str_x text_P = (const prog_char *) pgm_read_word (& cmd->text); // Ist das der gesuchte String? if (strcmp_P (text, text_P)) { ...
Lokale Variablen verwenden
Beim Manipulieren globaler Variablen kann es günstig sein, diese in eine lokale Variable zu kopieren, dort zu verändern, und sie danach wieder zu schreiben
char var; void foo1() { var++; if (var > 10) var = 1; }
Dadurch wird einmal unnötig gespeichert (der dritte Befehl kann vermieden werden).
foo1: lds r24,var ; *movqi/4 [length = 2] subi r24,lo8(-(1)) ; addqi3/2 [length = 1] sts var,r24 ; *movqi/3 [length = 2] cpi r24,lo8(11) ; cmpqi/2 [length = 1] brlt .L3 ; branch [length = 1] ldi r24,lo8(1) ; *movqi/2 [length = 1] sts var,r24 ; *movqi/3 [length = 2] .L3: ret
Indem man eine lokale Variable (var2) verwendet für die Änderung von var vermeidet man dies:
char var; void foo2() { char var2 = var; var2++; if (var2 > 10) var2 = 1; var = var2; }
Dadurch wird erst am Ende gespeichert. var2 lebt in Register r24.
foo2: lds r24, var ; *movqi/4 [length = 2] subi r24,lo8(-(1)) ; addqi3/2 [length = 1] cpi r24,lo8(11) ; cmpqi/2 [length = 1] brlt .L2 ; branch [length = 1] ldi r24,lo8(1) ; *movqi/2 [length = 1] .L2: sts var, r24 ; *movqi/3 [length = 2] ret
Bei diesem einfachen Beispiel spart man lediglich eine Instruktion. Bei komplexeren Rechnungen oder längeren Datentypen kann es aber durchaus lohnender sein, in lokale Register zu kopieren.
Arithmetik
Daten zerlegen/zusammensetzen
In systemnahen Programmen hat man oft was Problem, auf die einzelnen Bytes oder Bitfelder einer grösseren Datenstruktur zuzugreifen. Indem man sich ein Komposit baut, das die gewünschten Strukturen überlagert, kann man effizient z.B. auf Bytes zugreifen. Ausnahme sind Bitfelder, deren Verwendung etwas breiten Code ergibt. Bitfelder "von Hand" zu manipulieren, ist da manchmal effizienter, führt jedoch zu schlecht lesbarem Code.
Oft benötigt wird der Zugriff auf die einzelnen Bytes eines int, also der Zugriff auf die Bytes eines 16-Bit-Wertes:
typedef union { unsigned char asByte[2]; unsigned short asWord; int asInt; } data16_t; data16_t data; ... int foo; uint8_t wert; data.asInt = foo; wert = data.asByte[1]; // die oberen 8 Bits von foo
Ein komplexeres Beispiel, das noch mehr Datentypen überlagert:
typedef ... foo_t; typedef union { unsigned char byte[4]; // Zugriff als Bytes (8 Bit) unsigned short word[2]; // Zugriff als Words (16 Bit) signed long slong; // Zugriff als signed long (32 Bit) struct // Zugriff auf einzelne Bitgruppen { unsigned bit_0_3 : 4; // 4 Bits (0..3) unsigned bit_4_8 : 5; // 5 Bits (4..8) unsigned bit_9_21 : 13; // 13 Bits (9..21) unsigned bit_22_31: 10; // 10 Bits (22..31) }; foo_t foo; // Zugriff als foo-Struktur } data_t; ... { data_t data; data.byte[2] = 12; // setzt byte 2 auf 12 data.bit_4_8 = 0x1f; // setzt bits 4..8 (5 Stück) alle auf 1 int anInt = data.foo.anInt; // liest ein Feld von foo (hier ein int) ... }
libgcc2 verwenden
In der libgcc2 sind einige Arithmetik-Routinen in Assembler implementiert. Dazu gehören ein paar Algorithmen zu Division (mit Rest) und Multiplikation.
Von diesen Algorithmen werden durch die avr-libc jedoch nur zwei Strukturen und Funktionen veröffentlicht: div_t und ldiv_t resp. die Funktionen div() und ldiv(). Siehe dazu deine Dokumentation zur avr-libc. Damit kann man Quotient und zusätzlich den Rest bei einer Division 16/16 bzw. 32/32 berechnen lassen; den Rest bekommt man quasi kostenlos als Nebenprodukt. Das ist praktisch, wenn man z.b. eine Zahl in Dezimaldarstellung umwandeln möchte oder von/nach BCD.
Zusätzlich zu den via avr-libc veröffentlichten Funktionen gibt es aber noch Routinen, die z.B. auf 8-Bit-Werten operieren oder mit unsigned Typen und dementsprechend effizienter sind.
Beispiel: Umwandeln nach Dezimalstring
Hier ein Beispiel, das Division mit Rest für unsigned short verwendet, um eine 16-Bit-Zahl in Dezimaldarstellung zu wandeln:
// Struktur definieren und Funktion bekannt machen typedef struct { unsigned short quot; unsigned short rem; } udiv_t; extern udiv_t udiv (unsigned short, unsigned short) __asm__("__udivmodhi4"); // 5 Ziffern (0...65535) und evtl. noch eine führende 0 #define DIGITS 6 // +1 wegen String-Ende (wird im Startup auf 0 gesetzt) char string[DIGITS+1]; // Wandelt zahl in Dezimaldarstellung um. // Der return-Wert zeigt irgendwo ins string[]-Array. // string[] wird verändert. char* toString (unsigned short zahl) { // s zeigt auf das Ende von string // string wird von hinten nach vorne gefüllt char *s = string + DIGITS; // qrem enthält Quotient (quot) und Rest (rem) der Divisionen udiv_t qrem = {.quot = zahl}; do { // Division mit Rest durch 10 // quot: Ergebnis für den nächsten Durchlauf // rem: Rest ist die Ziffer im 10er-System qrem = udiv (qrem.quot, 10); // Ziffer in Zeichen wandeln und speichern *(--s) = '0' + qrem.rem; } while (0 != qrem.quot); // Falls eine führende '0' gespeichert wurde: weg damit // ausser zahl war selbst schon 0 if (*s == '0' && *(s+1) != '\0') s++; return s; }
Falls man eine Division und/oder Rest für 8-Bit braucht, dann geht für unsigned analog.
Beispiel: BCD-Umrechnung
Wandeln einer 8-Bit-Zahl 0 <= num < 100 nach BCD
typedef struct { unsigned char quot; // Quotient unsigned char rem; // Rest (remainder) } udiv8_t; extern udiv8_t udiv8 (unsigned char, unsigned char) __asm__ ("__udivmodqi4"); // Wandelt num nach BCD um, 0 <= num <= 99 // return-Wert ist dann 0x0 <= return <= 0x99 unsigned char to_bcd (unsigned char num) { udiv8_t qrem = udiv8 (num, 10); return (unsigned char) (qrem.quot << 4) | qrem.rem; }
Division durch Multiplikation
Vermeiden von float und double
Inkompatibilität
GCC – und somit auch avr-gcc – werden ständig weiter entwickelt. Dies betrifft das Beheben von Fehlern, die Unterstützung neuer Architekturen/Sprachen/Betriebssysteme, Implementierung neuer Optimierungsalgorithmen, Vereinheitlichungen, etc.
Leider führt dies auch zu Inkompatibilitäten verschiedener avr-gcc-Versionen untereinander, und eine C-Quelle, die mit einer Version von avr-gcc fehler- und warnungsfrei übersetzt werden kann, ist mit einer anderen Version möglicherweise nicht compilierbar.
Die avr-gcc Version kann man anzeigen lassen, indem man in einer Shell/Eingabeaufforderung eintippt
avr-gcc -v
- #include <avr/signal.h>
- In Versionen bis 3.4.4 werden in dieser Header-Datei u.a. die Makros SIGNAL() und INTERRUPT() definiert, die man braucht, wenn man eine C-Funktion als Interrupt-Routine (ISR) kennzeichnen will. In neueren Versionen ab 3.4.5 sind diese Definitionen in den Header avr/interrupt.h gewandert, wo auch Makros wie sei() und cli() definiert werden. Die Inkludierung von avr/signal.h in den neueren avg-gcc Versionen führt zu einer Warnung, irgendwann vielleicht sogar zu einem Fehler, weil die Datei nicht mehr bei avr-gcc dabei ist und daher nicht mehr gefunden wird.
- Verwendet man bei einer älteren avr-gcc-Version SIGNAL bzw. INTERRUPT ohne avr/signal.h zu includen, wird u.U. stillschweigend falscher Code erzeugt.
- #include <util/...h>
- In util stehen jetzt Header wie util/parity.h oder das vielverwendete util/delay.h, die vormals im Include-Unterverzeichnis avr zu finden waren.
- Interrupt Service Routinen
- Auch die API zur Definition von ISRs hat sich von avr-gcc Version 3.x zur Version 4.x geändert:
- avr-gcc 3.x
SIGNAL (SIG_INTERRUPT0) { /* Interrupt Code */ } INTERRUPT (SIG_OVERFLOW0) { /* Interrupt Code */ }
- avr-gcc 4.x
ISR (INT0_vect) { /* Interrupt Code */ } void TIMER0_OVF_vect (void) __attribute__((interrupt)); void TIMER0_OVF_vect (void) { /* Interrupt Code */ }
Bugs
- __builtin_return_address(0)
- ist entgegen der Spezifikation nicht implementiert und liefert in der Regel ein falsches Ergebnis.
- Workaround (hier für eine ISR):
#include <stdarg.h> #include <avr/interrupt.h> // The return address unsigned short volatile return_addr; // Define our special SIGNAL (INTERRUPT analoguous) #define SIGNAL_BRA(signame,var) \ void signame (unsigned short var, ...) __attribute__ ((signal)); \ void signame (unsigned short var, ...) #define SWAP_BYTES(x) (((x) >> 8) | ((x) << 8)) SIGNAL_BRA (SIG_OUTPUT_COMPARE1A, dummy) { { va_list vlist; va_start (vlist, dummy); // Get the return address from the stack dummy = va_arg (vlist, unsigned short); // Convert stack address to code location addr = SWAP_BYTES(dummy) << 1; va_end (vlist); } // ISR Code }
- gcc 4.x
- In der 4er-Version gab es tiefgreifende interne Änderungen im Compiler; er ist noch instabil und kann momentan nicht für den Produktiv-Einsatz empfohlen werden (Stand 02/2006).
- Die Auswirkungen der Optimierungen auf das Zielsystem avr bleibt abzuwarten, dürfte aber nicht wesentlich sein. Die neue 4-er Version wurde u.a. deshalb aufgelegt, um mit dem Intel-Compiler gleichzuziehen – also im Hinblick auf das Zielsystem i386) gemacht.
- Auch nach dem Release der 4-er Version wird die 3-er Version weiterentwickelt, da erst nach 1-2 Jahren nach Release einer neuer Major-Version ein Umstieg anzuraten ist und auch erst dann getätigt wird (zumindest im professionellen Bereich).
Abkürzungen und Bezeichnungen
- GCC
- GNU Compiler Collection
- gcc
- GNU C-Compiler
- GPR
- General Purpose Register
- ISR
- Interrupt Service Routine
- IRQ
- Interrupt Request
- Prolog/Epilog
- Code am Anfang/Ende jeder Funktionen/ISR, der dazu dient, verwendete Register zu sichern, den Stack-Frame für lokale Variablen anzulegen (falls benötigt), Stackpointer zu setzen, zurück zu springen (ret, reti), etc.
- SFR
- Special Function Register
- Target
- Zielsystem, in unserem Falle avr
Siehe auch
Code-Beispiele
- Hallo Welt für AVR (LED blinken) - ein erstes Beispiel für avr-gcc
- C-Codebeispiele
- Fallstricke bei der C-Programmierung
Details
Installation (Linux)
Sonstiges
Weblinks
Dokumentation
- GCC online documentation (en) Offline findest du die Doku für gcc, cpp (Präprozessor) und avr-libc bei WinAVR in
<GCC_HOME>/doc/gcc/
- bzw.
<GCC_HOME>/doc/avr-libc/
- Online finden sich die Dokumente in
- gcc.pdf (1900 kByte) - Dokumentation des C/C++/Java-Compilers GCC (en)
- cpp.pdf (470 kByte) - Dokumentation des C-Präprozessors (en)
- http://www.nongnu.org/avr-libc/user-manual - Dokumentation zur avr-libc.
Downloads
- WinAVR-Projekt bei sourceforge.net (en)
- avr-gcc und toolchain als Linux-Paket bei sourceforge.net (en)
Tipps, Installation
- "Installing the GNU Tool Chain" Hilfe zum Build und Installation von GCC, binutils, etc unter Linux
- Im GCC-Handbuch, siehe Dokumentation.
- www.linuxfocus.org (Artikel) - Tipps zu Build und Installation von avr-gcc, binutils und avr-libc unter Linux
- Rich Neswold: A GNU Development Environment for the AVR Microcontroller
- www.mikrocontroller.net (Foren-Beitrag) - Installation von GCC und Toolchain unter Mac OS X
- www.roboternetz.de (Foren-Beitrag) avrgcc + avrdude installieren
Sonstiges
- Offizielle Homepage von GCC (en)
- GCC in der deutschen Wikipedia
- avr-gcc-Tutorial auf mikrocontroller.net
- avr-gcc bei avrfreaks.net (en)
- Nützliche GCC Runtime-Libary
Autor
--SprinterSB 11:27, 7. Dez 2005 (CET)