Introducere in asamblare

(Categoria Limbaje de programare, Autor Cristian Botau)

Acest articol prezinta un limbaj mai putin folosit : limbajul de asamblare. Este folosit de cele mai multe ori pentru marirea vitezei de rulare a programelor. In prima sectiune sunt prezentate cateva avantaje / dezavantaje in folosirea acestui limbaj, iar ulterior sunt definite notiunile elementare ce trebuie stiute inainte de a trece la tratarea limbajului propriu-zis. De asemenea, sunt prezentate cateva intructiuni si transcrieri ale unor structuri din C/Pascal in limbaj de asamblare. In final sunt comparati timpii de executie intre varianta pascal si varianta assembler ale unei proceduri de Bubble Sort.

Limbajul de asamblare pe mediul x86 exista in doua tipuri de sintaxe :

  • Intel
  • AT&T

Sintaxa depinde de compilatorul folosit. De exemplu: Turbo Assembler (inclus in pachetul BC3.1) si Netwide Assembler (NASM) folosesc sintaxa Intel. GAS (folosit de GCC) foloseste sintaxa AT&T.
Nota: In GCC se poate folosi si sintaxa Intel, detalii aici .

O alta diferenta importanta este felul in care este interpretat cuvantul cheie asm in diferite compilatoare C/C++.
De exemplu, aceeasi instructiune in mediul Borland, si GCC cu cele 2 sintaxe :

Borland C 3.1 (sau TASM)
asm { mov ax, bx };
GCC (sintaxa AT&T)
asm ("mov %bx, %ax");
GCC (sintaxa Intel)
asm (".intel_syntax noprefix\n\t"
     "mov ax, bx");

Exemplele prezentate in acest articol sunt scrise in sintaxa Intel.

Limbajul de asamblare : avantaje si dezavantaje in folosirea lui

Desi este unul dintre cele mai vechi limbaje de programare, limbajul de asamblare este incorporat si in cele mai noi compilatoare cum ar fi Visual C++ si Delphi. Codul de asamblare este foarte apropiat de codul executabil al programelor, asamblorul avand rolul de a codifica instructiunile din limbaj de asamblare in cod masina.

In prezent, limbajul de asamblare este din ce in ce mai putin folosit in scrierea programelor, deoarece compilatoarele de ultima generatie au functiile cele mai folosite de programatori deja scrise si optimizate in limbaj de asamblare (gen memmove, memset / fillchar, etc.) incluse in unit-uri si biblioteci. Bineinteles, daca se doreste atingerea unor timpi de executie foarte mici, folosirea limbajului de asamblare este preferabila (cand avem algoritmul de complexitate optima).

Avantaje ale limbajului de asamblare

  • Viteza foarte mare de executie a programelor (unele programe scrise si optimizate in asamblare au viteza de executie pana la 5-10 de ori mai mare decat cele scrise in C sau Pascal);
  • Marimea codului executabil este foarte mica;
  • Ajuta utilizatorul sa inteleaga mai bine cum functioneaza microprocesorul si sa scrie programe eficiente si in High Level Languages.

Dezavantaje ale limbajului de asamblare

  • nu este portabil; un program scris pentru calculatoare IBM PC nu va rula pe un Apple Macintosh (difera unele instructiuni);
  • un program in asamblare este mai greu de scris si ia mai mult timp decat un program scris in Pascal sau C;
  • un program scris in asamblare este mai greu de depanat;

Majoritatea compilatoarelor din prezent permit programatorului sa scrie anumite parti de cod sau subprograme in asamblare, astfel incat programatorul sa poata scrie in asamblare doar partea din program care se executa de cele mai multe ori, programul ruland astfel mult mai rapid. Sunt si compilatoare dedicate exclusiv limbajului de asamblare, cum ar fi TASM - Turbo Assembler (il gasiti in directorul BP/Bin), MASM - Microsoft Assembler, etc.

Pentru a scrie o secventa de limbaj de asamblare intr-un program C se foloseste cuvantul rezervat asm :

asm { instructiuni in asamblare };

iar in pascal :

asm
    cod asamblare
end.

Notiuni de baza ale limbajului de asamblare

Registrii

Limbajul de asamblare este foarte apropiat de codul executabil, deci pentru ca programatorul sa fie capabil sa scrie codul in asamblare trebuie sa cunoasca modul in care functioneaza microprocesorul si modul in care acesta executa instructiunile.

Toate operatiile aritmetice/logice/acces la memorie se fac prin intermediul registrilor. Registrii microprocesorului sunt asemanatori variabilelor (pot fi initializati cu anumite valori, se pot efectua operatii asupra lor, pot fi accesati (cititi/modificati)).
Registrii microprocesorului sunt clasificati in mai multe categorii :

  • registri de uz general : eax, ebx, ecx, edx si subregistrii lor;
  • registri segment : cs (code segment), ds (data segment), es (extra segment), ss (stack segment) - sunt folositi pentru adresarea memoriei in cazul modelului de memorie segmentat
  • registrii index : esi, edi (source index, destination index);
  • registri speciali : ebp, esp, ip;

Registrii de uz general sunt folositi in executia operatiilor aritmetice si logice. Registrii de segment si cei index sunt folositi in adresarea memoriei, iar cei speciali sunt folositi de microprocesor si S.O. pentru rularea programelor.

Registrii de uz general

Acestia sunt :

  • eax - numit si "accumulator" - acesta este cel mai folosit in executarea operatiilor aritmetice (adunare, scadere, inmultire, impartire);
  • ebx - numit si "base" - acesta registru este folosit pentru adresarea indirecta a memoriei;
  • ecx - numit si "count" - acest registru este folosit mai ales in cadrul "buclelor" (in instructiunile repetitive : for/ while do/ do while/ repeat until);
  • edx - numit si "data" - retine anumite variabile, si este folosit impreuna cu eax in executarea operatiei "div", impartire intreaga (avand rolul de a retine restul impartirii).

Dupa cum ati observat, fiecare registru general are o functie specifica, insa oricare din ei pot fi folositi si la operatii aritmetice/logice, adresare memorie sau ca si variabile.

Registrii precedati de prefixul "e" sunt pe 32 de biti, deci pot fi tratati ca si variabile unsigned long/signed long (doubleword). Acestia pot fi folositi si ca registri pe 16 biti (word) sau pe 8 biti (byte) prin intermediul "subregistrilor" : ax, bx, cx, dx (reprezinta word-ul nesemnificativ = cel din dreapta)., ah, bh, ch, dh (byte-ul cel mai semnificativ al ax, bx, cx, dx), al, bl, cl, dl(registrii pe 8 biti).

Registrii de segment si index

Acesti registri sunt folositi la adresarea memoriei.
De exemplu
Avem variabila void *x;(x : pointer in pascal);
pentru modelul de memorie segmentata, in adresarea memoriei adresate de x se folosesc intructiunile (vezi "Intructiunile de baza ale unui microprocesor 8086") :

// es:[di] va accesa adresa pointata de x;
les di, x
// se copiaza in ax primul word
// de la adresa es:[di]
mov ax, es:[di]
// se copiaza in al cel de-al 3-lea byte
// de la adresa es:[di]
mov al, es:[di+2]

Parantezele drepte se refera la zona de memorie adresata de registru.
Exemplu :

"[esi]" se refera la valoarea aflata la adresa de memorie cu offset-ul esi, iar "esi" se refera la valoarea stocata in registrul esi;

daca esi = 100 atunci [esi] va reprezenta valoarea care se afla la adresa cu offset-ul 100, iar esi va reprezenta valoarea 100.

Va sfatuiesc sa NU incercati sa modificati urmatorii registri : cs (care contine segmentul la care se afla incarcat codul executabilului, ss contine segmentul de memorie in care se afla stiva sistemului).

Registrii speciali

Sunt folositi foarte rar in scrierea efectiva a programelor, deci nu veti accesa prea des acesti registri.De exemplu, ip (instruction pointer) care retine adresa (de fapt offset-ul) la care se afla instructiunea care urmeaza sa fie executata.

Flagurile microprocesorului

Flag-urile microprocesorului sunt asemanatoare unor variabile boolene. Cu ajutorul lor putem afla rezultatul unei comparatii sau daca o operatie a produs "overflow", etc. Aceste flag-uri nu pot fi accesate direct ca si registrii, ci testarea daca un flag este activat se face prin intermediul "jump"-urilor conditionate.(vezi instructiunea cmp).

Exemplu :
Fie ax = 1. Decrementarea lui ax cu 1 va duce la activarea flagului numit Zero-Flag.(rezultatul operatiei a fost 0).
Fie ax = 65535 (0xFFFF). Incrementarea lui ax cu 2 va duce la setarea flagului numit Overflow-Flag (rezultatul operatiei nu "incape" in 16 biti);

Instructiunile de baza ale microprocesorului 8086

Sunt folosite urmatoarele prescurtari :

  • reg8/ reg16/ reg32 - se refera la registri pe 8/16/32 biti;
  • imm8/ imm16/ imm32 - se refera la valori imediate (constante);
  • mem8/ mem16/ mem32 - zona memorie de memorie sau variabile pe 8/16/32 biti;

Instructiunea MOV

Sintaxa:

  • mov dest, source // echivalenta cu dest = source

Variante:

  • mov reg8/16/32, mem8/16/32
  • mov reg8/16/32, reg8/16/32
  • mov mem8/16/32, reg8/16/32
  • mov reg8/16/32, imm8/16/32
  • mov mem8/16/32, imm8/16/32

Descriere:

Instructiunea copiaza o valoare dintr-o locatie in alta locatie. Aceasta locatie poate fi zona de memorie, variabila, registru. De retinut este ca nu exista variante ale instructiunii care copiaza direct dintr-o zona de memorie in alta.

Flaguri afectate:

Instructiunea mov nu modifica nici un flag.

Restrictii:

Ambii operanzi trebuie sa aiba aceeasi marime. De exemplu pentru ultima varianta a instructiunii mov trebuie specificata marimea zonei de memorie. Instructiunea "mov [bx], 0" nu este corecta deoarece compilatorul nu stie ce vrea sa faca instructiunea: sa copieze valoarea 0 in byte-ul, in word-ul sau in doubleword-ul de la adresa bx. Astfel variantele corecte sunt:

mov byte ptr [bx], 0
mov word ptr [bx], 0
mov dword ptr [bx], 0

Exemplu:

mov ax, 3 // ax = 3
mov bx, ax // bx = ax

Instructiuni aritmetice. Instructiunile ADD, SUB, INC, DEC

Sintaxa:

  • add dest, source // echivalenta cu dest+=source
  • sub dest, source // echivalenta cu dest-=source
  • inc dest // echivalenta cu dest++
  • dec dest // echivalenta cu dest--

Variante:

  • add(sub) reg8/16/32, mem8/16/32
  • add(sub) reg8/16/32, reg8/16/32
  • add(sub) mem8/16/32, reg8/16/32
  • add(sub) reg8/16/32, imm8/16/32
  • add(sub) mem8/16/32, imm8/16/32

Descriere:

Instructiunea "add" este folosita pentru a aduna doua valori, "sub" pentru a scadea o valoare din alta, "inc" - incrementarea unei variabile, "dec" - decrementarea unei variabile (registru/memorie).

Flaguri afectate:

  • carry flag - pentru "signed overflow"
  • overflow flag - pentru overflow
  • sign flag - activat daca rezultatul este negativ
  • zero flag - activat daca rezultatul operatiei a fost 0
  • parity flag - este setat in functie de paritatea rezultatului

Restrictii:

Destinatia trebuie sa aiba aceeasi marime ca si sursa.

Exemplu:

mov ax, 3 // ax = 3
add bx, ax // bx = ax+3

Instructiuni pe biti. Instructiunile AND, TEST, OR, XOR, NOT

Sintaxa:

  • and dest, source // echivalenta cu dest&=source
  • test dest, source // dest & source
  • or dest, source // echivalenta cu dest|=source
  • xor dest, source // echivalenta cu dest^=source
  • not dest // ~dest

Variante:

Pentru "and", "or", "test", "xor" sunt ca si cele de la "add". Pentru "not" avem doua variante :

  • not reg8/16/32
  • not mem

Descriere:

Executa operatiile pe biti corespunzatoare. Instructiunea test (non-destructive and) este asemanatoare lui and, dar nu afecteaza rezultatul ci doar flagurile.

Flaguri afectate:

Instructiunea "not" nu afecteaza nici un flag.
Flagurile afectate de celalalte instructiuni sunt :

  • carry, overflow - le dezactiveaza
  • sign flag - este copiat bitul cel mai semnificativ din rezultat (semnul rezultatului, de fapt)
  • zero flag - activat daca rezultatul operatiei a fost 0
  • parity flag - este setat in functie de paritatea rezultatului

Restrictii:

Destinatia trebuie sa aiba aceeasi marime ca si sursa.
Instructinile OR/XOR/INC/DEC modifica flag-urile microprocesorului: Carry(numai ADD/SUB), Overflow, Zero, Parity.

Exemplu:

mov ax, 5 // ax = 3
test ax, 1 // daca (ax & 1)
jz @skip // daca ax este nu este impar sari la @skip
// executa instructiuni
@skip
and bx, FFFEh // bx = bx & 0xFFFE (se sterge bitul cel mai nesemnificativ)

Instructiunile PUSH/POP

Descriere:

Aceste instructiuni sunt folosite pentru accesarea stivei sistemului. Instructiunea PUSH pune pe stiva sistemului o valoare, iar instructiunea POP extrage valoarea din varful stivei.

Sintaxa:

  • push val
  • pop val

Variante:

  • push reg8/16/32
  • pop reg8/16/32

Exemplu:

@lp:
push cx // salvam valoarea cx
... // prelucreaza datele, se poate modifica cx
pop cx // scoate de pe stiva valoarea cx
dec cx
jnz @lp // daca (cx != 0) atunci sari inapoi la @lp

Instructiunea CMP

Descriere:

Compara doua valori si seteaza flag-urile microprocesorului cu rezultatele compararii. De cele mai multe ori este folosita in combinatie cu jump-urile (vezi mai jos).

Sintaxa:

  • cmp val1, val2

Variante:

  • cmp reg8/16/32, reg8/16/32
  • cmp reg8/16/32, imm8/16/32
  • cmp mem8/16/32, reg8/16/32
  • cmp mem8/16/32, imm8/16/32

Jump-urile neconditionate (JMP) si jump-urile conditionate (JE, JNE, JB, JBE, JA, JAE, JZ, JNZ)

Aceste instructiuni sunt folosite pentru generarea instructiunilor If /while do /do while /repeat /for.Sunt asemanatoare instructiunii goto din C/Pascal.

Sintaxa:

instructiune label

  • JE * "sare" cu executia programului la label daca flag-ul equality este setat;
  • JNE * "sare" cu executia programului la label daca flag-ul equality nu este setat;
  • JB * "sare" cu executia programului la label daca flag-ul below este setat;
  • JBE * "sare" cu executia programului la label daca flag-ul below sau flagul equality este setat;
  • JA * "sare" cu executia programului la label daca flag-ul below nu este setat;
  • JAE * "sare" cu executia programului la label daca flag-ul equality este setat sau flag-ul below nu este setat;
  • JZ * "sare" cu executia programului la label daca flag-ul zero este setat;
  • JNZ * "sare" cu executia programului la label daca flag-ul zero nu este setat;
  • JMP * "sare" cu executia programului la label;

Exemplu:

mov ax, 1
@loop :
    instr1
    instr2
    *
    inc ax
    // compara ax cu valoarea 10 si seteaza flagurile
    cmp ax, 10
    // daca ax != 10 sari inapoi la @loop

jne @loop

== code(cpp) |instr1
jmp @label1
    instr2
    instr3
@label1 :

In ultimul exemplu instr2 si instr3 nu vor fi executate deoarece inaintea lor se afla instructiunea jump care face ca programul sa sara cu executia la instructiunea imediat urmatoare etichetei "label1".

Instructiunea LOOP

Instructiunea "loop" este folosita de obicei in transcrierea for-urilor si a buclelor.

Sintaxa:

  • loop label

Descriere:

Echivalenta cu :

dec ecx (sau dec cx)
jz label

Instructiunea INT

Descriere:

Instructiunea INT apealeaza o intrerupere.

Sintaxa:

  • INT nr_intrerupere (un numar cuprins intre 0 si 255);

Intreruperile opresc programul din rulare, executa un anumit cod si apoi permit continuarea rularii programului. Cu ajutorul apelului intreruperilor aplicatia poate sa comunice cu sistemul de operare, si cu unele componente hardware ale calculatorului (mouse-ul, tastatura, imprimanta, etc). Fiecare intrerupere are asociat un numar.

Exemple:

  • 0x9 : intreruperea pentru tastatura;
  • 0x10 : intreruperea care ofera serviciile BIOS pentru accesul la placa video;
  • 0x21 : intreruperea sistemului de operare DOS;
  • 0x33 : intreruperea pentru mouse;

In DOS pentru initializarea mouse-ului se va apela functia numarul 0 a intreruperii 0x33 :

asm
{
    mov ax, 0
    // seteaza registrul ax cu valoarea 0 pentru ca
    // driverul ce gestioneaza intreruperea 0x33
    //sa stie ca trebuie sa initializeze mouse-ul
    int 0x33
}

Pentru afisarea mouse-ului :

asm
{
    mov ax, 1
    int 0x33
}

Pentru ascunderea cursorului de la mouse :

asm
{
    mov ax, 2
    int 0x33;
}

Transcrierea unor instructiuni C/PASCAL in asamblare

IF cond THEN instr

Exemplu :

if (a==5) b=a; // a, b : integer
mov ax, a
cmp ax, 5
// ne intrebam daca !cond
jnz @skip_if
mov b, ax
@skip_if :

IF cond THEN instr1 ELSE instr2

Exemplu:

if (a==b) a-=b; else b-=a;

Transcrierea in asamblare :

mov ax, a
mov bx, b
// compara ax cu bx si seteaza flag-urile
cmp ax, bx
je @if_then
// if (ax == bx) sari la @if_then
sub b, ax
jmp @end_if :
@if_then :
sub a, bx
@end_if :

DO { inst } WHILE

Exemplu :

int i, a, n;
i = 0;
a = 0;
do
{
    i++;
    a+=i;
} while (i<=n);

Codul in asamblare :

// cx = 0, instructiunea xor cx, cx este
// mai rapida decat mov cx, 0
xor cx, cx
xor ax, ax
mov bx, n
@while :
    inc cx
    add ax, cx
    cmp cx, bx
    jne @while
mov a, ax
mov I, cx

Sau folosind instructiunea loop (pornim invers) :

mov cx, n
@while:
    add ax, cx
loop @while

In codul de mai sus (prima varianta) puteti observa cateva mici optimizari : retinerea variabilelor in registri (accesul la registri este mult mai rapid decat la memorie), inlocuirea instructiunii {mov reg, 0 cu xor reg, reg. Varianta "xor" este mai rapida (desi mov si xor "teoretic" au tot atatea ceasuri de procesor) deoarece instructiunea mov reg, 0 transcrisa in cod masina este mai "lunga" (are cu 2-4 bytes mai mult decat xor reg, reg). Aceeasi regula se aplica si in cazul "or reg, reg" in testarea daca valoarea unui registru este egala cu 0, intrucat instructiunea "or" modifica flagurile procesorului (ZeroFlag). O alta optimizare este folosirea registrului ax pentru calcule (in majoritatea cazurilor instructiunile care folosesc registrul ax sunt mai rapide).

Program demonstrativ

Exemplu de functie in realizata in C/Asamblare (compilator folosit BC++ 3.1):

// BSort.CPP
#include <stdio.h>
#include <conio.h>

int a[20], n;

void bsort()
{
	asm {
		mov di,seg a
		mov es,di
		mov di,offset a
		// es:[di] inceputul vectorului
		// es - adresa segment
		// di - adresa offset
	};

do_while_not_ok :
	asm {
		// ok = 1;
		mov dx, 1
		// cx = n;
		mov cx, n
		// cx = n-1

		dec cx
		// ax = a[0]
		mov ax, es:[di]
		// punem di pe stiva
		push di
	}
inner_for :
	asm {
		// bx = a[i-1]
		mov bx, ax
		// ne mutam pe noua pozitie in vector
		add di, 2
		// ax = a[i]
		mov ax, es:[di]
		// comparam ax cu bx (a[i-1] cu a[i])
		cmp bx, ax
		// if (a[i-1] <= a[i]) don't swap
		jbe if_not
		// interschimbam a[i-1] cu a[i]
		xchg bx, ax
		// le scriem in memorie
		mov es:[di], ax
		mov es:[di-2], bx
		// ok = 0
		xor dx, dx
	}
if_not :
	asm {
		// cx--;
		dec cx
		jnz inner_for
		// daca cx != 0 atunci continuam for-ul
		pop di
		// compara dx cu 0
		// (mai rapid decat cmp dx, 0)
		or dx, dx
		// if (ok) executam inca odata while-ul
		jz do_while_not_ok
	}
}

void citire()
{
	printf("Numarul de elemente : ");
	scanf("%d", &n);
	for (int i=0; i<n; i++)
	{
		printf("a[%d] = ", i);
		scanf("%d", &a[i]);
	}
}

void afis()
{
	for (int i=0; i<n; i++)
		printf("%d ", a[i]);
}

int main()
{
	citire();
	bsort();
	afis();
	return 0;
}

Varianta Pascal + Asm (compilata cu BP 7.0):

program b_sort;

const   max_N = 1000;
        n_tests = 100;

var N : Integer;
    a, b : array [1..max_N] of Integer;

procedure citire;
var f : Text;
    i : Integer;
begin
    Assign(f, 'bsort.in'); Reset(f);
    readln(f, N);
    for i := 1 to N do
        read(f, b[i]);
    Close(f)
end;

procedure flip;
var i : Integer;
begin
    for i:=1 to N do
        a[i] := b[i];
end;

var p : pointer;

procedure bsort; assembler;
asm
{ les <=> es = seg(p), di = offset(p) }
    les di, p
    @do_while_not_ok :
        mov dx, 1
        mov cx, N
        dec cx
        mov ax, es:[di]
        push di
        @inner_for :
            mov bx, ax
            add di, 2
            mov ax, es:[di]
            cmp bx, ax
            jbe @if_not
            xchg bx, ax
            mov es:[di], ax
            mov es:[di-2], bx
            xor dx, dx
            @if_not :
                dec cx
                jnz @inner_for
        pop di
        or dx, dx
    jz @do_while_not_ok
end;

procedure bsort2;
var ok : Boolean;
    i, aux : Integer;
begin
    repeat
        ok := true;
        for i := 1 to n-1 do
            if (a[i] > a[i+1]) then
            begin
                aux := a[i];
                a[i] := a[i+1];
                a[i+1] := aux;
                ok := false;
            end;
    until ok;
end;

var i : Integer;
    starttick, endtick : LongInt;
    time : Longint absolute $0000:$046C;

{ timer pentru masurarea timpului }
const tickspersecond = 18.206;

procedure starttimer;
begin
    starttick := time;
end;

function elapsedtime : real;
begin
    endtick := time;
    elapsedtime := (endtick - starttick)*
        (1 / tickspersecond);
end;

begin
    citire;
    p := @a;
    starttimer;
    for i:=1 to n_tests do
    begin
        flip;
        bsort;
    end;
    writeln(n_tests, ' rulari ale bsort in asamblare
        au rulat in : ', elapsedtime : 6:3, ' secunde');
    starttimer;
    for i:=1 to n_tests do
    begin
        flip;
        bsort2;
    end;
    writeln(n_tests, ' rulari ale bsort obisnuit
            au rulat in : ',elapsedtime : 6:3, ' secunde');
end.

Output program pascal (pe pc-ul meu: Duron 750 Mhz):

  • 100 rulari ale bsort in asamblare au rulat in : 1.263 secunde
  • 100 rulari ale bsort obisnuit au rulat in : 4.614 secunde

De precizat este ca nu am optimizat programul aproape deloc (am transcris codul din pascal in asm). Cu optimizari "hardcore" se pot obtine timpi mult mai buni. Diferenta dintre varianta asm si varianta high level language este mai mica pe compilatoarele mai noi, cum ar fi GCC sau FreePascal deoarece acestea stiu genera un cod mai optimizat. Totusi, nici un compilator nu poate bate creierul uman.

Linkuri

Doua cuvinte conclusive...

Acest articol trateaza "bazele" programarii in asamblare, dupa cum ii zice numele este doar o introducere. Pentru a sti sa programezi in asm, trebuie invatate mult mai multe lucruri. Scopul articolului este de a starni interesul cititorilor si de a le oferi o imagine asupra acestui limbaj. Cei ce doresc sa invete mai multe despre assembly language sunt invitati sa citeasca cartile / tutorialele din sectiunea linkuri.

remote content