Diferente pentru introducere-in-asamblare intre reviziile #4 si #5

Nu exista diferente intre titluri.

Diferente intre continut:

* registrii index : esi, edi (source index, destination index);
* registri speciali : ebp, esp, ip;
Registrii de uz general sunt folositi in executia operatiilor aritmetice si logice. Registrii de segment si cei index sunt folositi in adresarea memoriei, iar cei speciali sunt folositi de microprocesor si S.O. pentru rularea programelor.
 
 
 
Registrii de uz general
 
Acestia sunt :
 
* eax * numit si "accumulator" * acesta este cel mai folosit in executarea operatiilor aritmetice (adunare, scadere, inmultire, impartire);
* ebx * numit si "base" * acesta registru este folosit pentru adresarea indirecta a memoriei;
* ecx * numit si "count" * acest registru este folosit mai ales in cadrul "buclelor" (in instructiunile repetitive * for/ while do/ do while/ repeat until);
* edx * numit si "data" * retine anumite variabile, si este folosit impreuna cu eax in executarea operatiei "div" * impartire intreaga (avand rolul de a retine restul impartirii).
 
Dupa cum ati observat, fiecare registru general are o functie specifica, insa oricare din ei pot fi folositi si la operatii aritmetice/logice, adresare memorie sau ca si variabile.
 
Registrii precedati de prefixul "e" sunt "pe 32 de biti", deci pot fi tratati ca si variabile unsigned long/signed long (doubleword). Acestia pot fi folositi si ca registri pe 16 biti (word) sau pe 8 biti (byte) prin intermediul "subregistrilor" : ax, bx, cx, dx (reprezinta word-ul nesemnificativ = cel din dreapta)., ah, bh, ch, dh (byte-ul cel mai semnificativ al ax, bx, cx, dx), al, bl, cl, dl(registrii pe 8 biti).
 
 
Registrii de segment si index
 
Acesti registri sunt folositi la adresarea memoriei.
De exemplu
Avem variabila void *x;(x : pointer in pascal);
pentru modelul de memorie segmentata, in adresarea memoriei adresate de x se folosesc intructiunile (vezi "Intructiunile de baza ale unui microprocesor 8086") :
 
 
 
// es:[di] va accesa adresa pointata de x;
 
les di, x
 
// se copiaza in ax primul word
 
// de la adresa es:[di]
 
mov ax, es:[di]
 
// se copiaza in al cel de-al 3-lea byte
 
// de la adresa es:[di]
 
mov al, es:[di+2]
 
Parantezele drepte se refera la zona de memorie adresata de registru.
Exemplu :
 
"[esi]" * se refera la valoarea aflata la adresa de memorie cu offset-ul esi, iar "esi" * se refera la valoarea stocata in registrul esi;
 
daca esi = 100 atunci [esi] * va reprezenta valoarea care se afla la adresa cu offset-ul 100, iar esi va reprezenta valoarea 100.
 
Va sfatuiesc sa NU incercati sa modificati urmatorii registri : cs (care contine segmentul la care se afla incarcat codul executabilului, ss * contine segmentul de memorie in care se afla stiva sistemului).
 
 
 
Registrii speciali
 
Sunt folositi foarte rar in scrierea efectiva a programelor, deci nu veti accesa prea des acesti registri.De exemplu, ip (instruction pointer) care retine adresa (de fapt offset-ul) la care se afla instructiunea care urmeaza sa fie executata.
 
 
 
Flagurile microprocesorului
 
Flag-urile microprocesorului sunt asemanatoare unor variabile boolene. Cu ajutorul lor putem afla rezultatul unei comparatii sau daca o operatie a produs "overflow", etc. Aceste flag-uri nu pot fi accesate direct ca si registrii, ci testarea daca un flag este activat se face prin intermediul "jump"-urilor conditionate.(vezi instructiunea cmp).
 
Exemplu :
 
Fie ax = 1. Decrementarea lui ax cu 1 va duce la activarea flagului numit Zero-Flag.(rezultatul operatiei a fost 0).
 
Fie ax = 65535 (0xFFFF). Incrementarea lui ax cu 2 va duce la setarea flagului numit Overflow-Flag (rezultatul operatiei nu "incape" in 16 biti);
 
 
 
 
 
Instructiunile de baza ale microprocesorului 8086 :
 
Sunt folosite urmatoarele prescurtari :
 
* reg8/ reg16/ reg32 * se refera la registri pe 8/16/32 biti;
* imm8/ imm16/ imm32 * se refera la valori imediate (constante);
* mem8/ mem16/ mem32 * zona memorie de memorie sau variabile pe 8/16/32 biti;
 
Scriere/Citire memorie si registri
 
Instructiunea MOV
 
Sintaxa
 
mov dest, source // echivalenta cu dest = source
 
Variante
 
mov reg8/16/32, mem8/16/32
mov reg8/16/32, reg8/16/32
mov mem8/16/32, reg8/16/32
mov reg8/16/32, imm8/16/32
mov mem8/16/32, imm8/16/32
 
Descriere
 
Instructiunea copiaza o valoare dintr-o locatie in alta locatie. Aceasta locatie poate fi zona de memorie, variabila, registru. De retinut este ca nu exista variante ale instructiunii care copiaza direct dintr-o zona de memorie in alta.
 
Flaguri afectate
 
Instructiunea mov nu modifica nici un flag.
 
Restrictii
 
Ambii operanzi trebuie sa aiba aceeasi marime. De exemplu pentru ultima varianta a instructiunii mov trebuie specificata marimea zonei de memorie. Instructiunea "mov [bx], 0" nu este corecta deoarece compilatorul nu stie ce vrea sa faca instructiunea: sa copieze valoarea 0 in byte-ul, in word-ul sau in doubleword-ul de la adresa bx. Astfel variantele corecte sunt:
 
mov byte ptr [bx], 0
 
mov word ptr [bx], 0
 
mov dword ptr [bx], 0
 
Exemplu
 
mov ax, 3 // ax = 3
mov bx, ax // bx = ax
 
 
 
Instructiuni aritmetice
 
Instructiunile ADD, SUB, INC, DEC
 
Sintaxa
 
add dest, source // echivalenta cu dest+=source
sub dest, source // echivalenta cu dest-=source
inc dest // echivalenta cu dest++
dec dest // echivalenta cu dest*
 
 
 
Variante
 
add(sub) reg8/16/32, mem8/16/32
add(sub) reg8/16/32, reg8/16/32
add(sub) mem8/16/32, reg8/16/32
add(sub) reg8/16/32, imm8/16/32
add(sub) mem8/16/32, imm8/16/32
 
Descriere
 
Instructiunea "add" este folosita pentru a aduna doua valori, "sub" pentru a scadea o valoare din alta, inc * incrementarea unei variabile, "dec" * decrementarea unei variabile (registru/memorie).
 
 
 
Flaguri afectate
 
Flagurile afectate de aceste instructiuni sunt :
 
carry flag - pentru "signed overflow"
 
overflow flag - pentru overflow
 
sign flag - activat daca rezultatul este negativ
 
zero flag - activat daca rezultatul operatiei a fost 0
 
parity flag - este setat in functie de paritatea rezultatului
 
 
 
Restrictii
 
Destinatia trebuie sa aiba aceeasi marime ca si sursa.
 
Exemplu
 
mov ax, 3 // ax = 3
add bx, ax // bx = ax+3
 
Instructiuni pe biti
 
Instructiunile AND, TEST, OR, XOR, NOT
 
Sintaxa
 
and dest, source // echivalenta cu dest&=source
 
test dest, source // dest & source
 
or dest, source // echivalenta cu dest|=source
 
xor dest, source // echivalenta cu dest^=source
 
not dest // ~dest
 
Variante
 
Pentru "and", "or", "test", "xor" sunt ca si cele de la add. Pentru "not" avem doua variante :
 
not reg8/16/32
 
not mem
 
 
 
Descriere
 
Executa operatiile pe biti corespunzatoare. Instructiunea test (non-destructive and) este asemanatoare lui and, dar nu afecteaza rezultatul ci doar flagurile.
 
 
 
Flaguri afectate
 
Instructiunea "not" nu afecteaza nici un flag.
 
Flagurile afectate de celalalte instructiuni sunt :
 
carry, overflow - le dezactiveaza
 
sign flag - este copiat bitul cel mai semnificativ din rezultat (semnul rezultatului, de fapt)
 
zero flag - activat daca rezultatul operatiei a fost 0
 
parity flag - este setat in functie de paritatea rezultatului
 
 
 
Restrictii
 
Destinatia trebuie sa aiba aceeasi marime ca si sursa.
Instructinile OR/XOR/INC/DEC modifica flag-urile microprocesorului: Carry(numai ADD/SUB), Overflow, Zero, Parity.
 
Exemplu
 
mov ax, 5 // ax = 3
test ax, 1 // daca (ax & 1)
jz @skip // daca ax este nu este impar sari la @skip
// executa instructiuni
@skip
and bx, FFFEh // bx = bx & 0xFFFE (se sterge
// bitul cel mai nesemnificativ)
 
 
 
Instructiunile PUSH/POP
 
Descriere
 
Aceste instructiuni sunt folosite pentru accesarea stivei sistemului. Instructiunea PUSH pune pe stiva sistemului o valoare, iar instructiunea POP extrage valoarea din varful stivei.
 
Sintaxa
 
push val
 
pop val
 
Variante
 
push reg8/16/32
 
pop reg8/16/32
 
Exemplu
 
@lp:
push cx // salvam valoarea cx
... // prelucreaza datele, se poate modifica cx
pop cx // scoate de pe stiva valoarea cx
dec cx
jnz @lp // daca (cx != 0) atunci sari inapoi la @lp
 
Instructiunea CMP
 
Descriere
 
Compara doua valori si seteaza flag-urile microprocesorului cu rezultatele compararii. De cele mai multe ori este folosita in combinatie cu jump-urile (vezi mai jos).
 
Sintaxa
 
cmp val1, val2
 
Variante
 
cmp reg8/16/32, reg8/16/32
 
cmp reg8/16/32, imm8/16/32
 
cmp mem8/16/32, reg8/16/32
 
cmp mem8/16/32, imm8/16/32
 
 
 
Jump-urile neconditionate (JMP) si jump-urile conditionate (JE, JNE, JB, JBE, JA, JAE, JZ, JNZ)
 
Aceste instructiuni sunt folosite pentru generarea instructiunilor If /while do /do while /repeat /for.Sunt asemanatoare instructiunii goto din C/Pascal.
Sintaxa : instructiune label
JE * "sare" cu executia programului la label daca flag-ul equality este setat;
JNE * "sare" cu executia programului la label daca flag-ul equality nu este setat;
JB * "sare" cu executia programului la label daca flag-ul below este setat;
JBE * "sare" cu executia programului la label daca flag-ul below sau flagul equality este setat;
JA * "sare" cu executia programului la label daca flag-ul below nu este setat;
JAE * "sare" cu executia programului la label daca flag-ul equality este setat sau flag-ul below nu este setat;
JZ * "sare" cu executia programului la label daca flag-ul zero este setat;
JNZ * "sare" cu executia programului la label daca flag-ul zero nu este setat;
JMP * "sare" cu executia programului la label;
 
Exemplu :
 
mov ax, 1
@loop :
instr1
instr2
*
inc ax
 
// compara ax cu valoarea 10
 
// si seteaza flagurile
cmp ax, 10
 
// daca ax != 10 sari inapoi la @loop
jne @loop
 
Exemplul 2:
 
instr1
jmp @label1
instr2
instr3
@label1 :
 
 
 
In ultimul exemplu instr2 si instr3 nu vor fi executate deoarece inaintea lor se afla instructiunea jump care face ca programul sa sara cu executia la instructiunea imediat urmatoare etichetei "label1".
 
 
 
Instructiunea LOOP
 
Instructiunea "loop" este folosita de obicei in transcrierea for-urilor si a buclelor.
 
Sintaxa
 
loop label
 
Descriere
 
Echivalenta cu :
 
dec ecx (sau dec cx)
jz label
 
Instructiunea INT
 
Descriere
 
Instructiunea INT apealeaza o intrerupere.
Sintaxa
INT nr_intrerupere (un numar cuprins intre 0 si 255);
 
Intreruperile opresc programul din rulare, executa un anumit cod si apoi permit continuarea rularii programului. Cu ajutorul apelului intreruperilor aplicatia poate sa comunice cu sistemul de operare, si cu unele componente hardware ale calculatorului (mouse-ul, tastatura, imprimanta, etc). Fiecare intrerupere are asociat un numar.
Exemple de intreruperi :
0x9 : intreruperea pentru tastatura;
0x10 : intreruperea care ofera serviciile BIOS pentru accesul la placa video;
0x21 : intreruperea sistemului de operare DOS;
0x33 : intreruperea pentru mouse;
 
In DOS pentru initializarea mouse-ului se va apela
 
functia numarul 0 a intreruperii 0x33 :
asm
{
mov ax, 0
 
// seteaza registrul ax cu valoarea 0 pentru ca
 
// driverul ce gestioneaza intreruperea 0x33
//sa stie ca trebuie sa initializeze mouse-ul
int 0x33
}
 
Pentru afisarea mouse-ului :
asm
{
mov ax, 1
int 0x33
}
 
Pentru ascunderea cursorului de la mouse :
asm
{
mov ax, 2
int 0x33;
}
 
 
 
 
 
Transcrierea unor instructiuni C/PASCAL in asamblare
 
 
 
* IF cond THEN instr
 
Exemplu : if (a==5) b=a; // a, b * integer
 
mov ax, a
cmp ax, 5
 
// ne intrebam daca !cond
jnz @skip_if
mov b, ax
@skip_if :
 
* IF cond THEN instr1 ELSE instr2
 
Exemplu : if (a==b) a-=b; else b-=a;
 
Transcrierea in asamblare :
 
mov ax, a
mov bx, b
 
// compara ax cu bx si seteaza flag-urile
 
cmp ax, bx
 
je @if_then
 
// if (ax == bx) sari la @if_then
sub b, ax
jmp @end_if :
@if_then :
sub a, bx
@end_if :
 
 
 
* DO { inst } WHILE
 
Exemplu :
 
int i, a, n;
i = 0;
a = 0;
do
{
i++;
a+=I;
} while (i<=n);
 
 
 
Codul in asamblare :
 
// cx = 0, instructiunea xor cx, cx este
 
// mai rapida decat mov cx, 0
xor cx, cx
 
xor ax, ax
mov bx, n
@while :
inc cx
add ax, cx
cmp cx, bx
jne @while
mov a, ax
mov I, cx
 
 
Sau folosind instructiunea loop (pornim invers) :
 
mov cx, n
 
@while:
add ax, cx
loop @while
 
In codul de mai sus (prima varianta) puteti observa cateva mici optimizari : retinerea variabilelor in registri (accesul la registri este mult mai rapid decat la memorie), inlocuirea instructiunii mov reg, 0 cu xor reg, reg. Varianta "xor" este mai rapida (desi mov si xor "teoretic" au tot atatea ceasuri de procesor) deoarece instructiunea mov reg, 0 transcrisa in cod masina este mai "lunga" (are cu 2-4 bytes mai mult decat xor reg, reg). Aceeasi regula se aplica si in cazul "or reg, reg" in testarea daca valoarea unui registru este egala cu 0, intrucat instructiunea "or" modifica flagurile procesorului (ZeroFlag). O alta optimizare este folosirea registrului ax pentru calcule (in majoritatea cazurilor instructiunile care folosesc registrul (e)ax sunt mai rapide).
 
 
 
 
 
Program demonstrativ
 
Exemplu de functie in realizata in C/Asamblare (compilator folosit BC++ 3.1):
 
// BSort.CPP
#include <stdio.h>
#include <conio.h>
 
int a[20], n;
 
void bsort()
{
asm {
mov di,seg a
mov es,di
mov di,offset a
// es:[di] inceputul vectorului
// es - adresa segment
// di - adresa offset
};
 
do_while_not_ok :
asm {
// ok = 1;
mov dx, 1
// cx = n;
mov cx, n
// cx = n-1
dec cx
// ax = a[0]
mov ax, es:[di]
// punem di pe stiva
push di
}
inner_for :
asm {
// bx = a[i-1]
mov bx, ax
// ne mutam pe noua pozitie in vector
add di, 2
// ax = a[i]
mov ax, es:[di]
// comparam ax cu bx (a[i-1] cu a[i])
cmp bx, ax
// if (a[i-1] <= a[i]) don't swap
jbe if_not
// interschimbam a[i-1] cu a[i]
xchg bx, ax
// le scriem in memorie
mov es:[di], ax
mov es:[di-2], bx
// ok = 0
xor dx, dx
}
if_not :
asm {
// cx--;
dec cx
jnz inner_for
// daca cx != 0 atunci continuam for-ul
pop di
// compara dx cu 0
// (mai rapid decat cmp dx, 0)
or dx, dx
// if (ok) executam inca odata while-ul
jz do_while_not_ok
}
}
 
void citire()
{
printf("Numarul de elemente : ");
scanf("%d", &n);
for (int i=0; i<n; i++)
{
printf("a[%d] = ", i);
scanf("%d", &a[i]);
}
}
 
void afis()
{
for (int i=0; i<n; i++)
printf("%d ", a[i]);
}
 
int main()
{
citire();
bsort();
afis();
return 0;
}
 
Varianta Pascal + Asm (compilata cu BP 7.0):
 
program b_sort;
 
const
max_N = 1000;
n_tests = 100;
 
var
N : Integer;
a, b : array [1..max_N] of Integer;
 
procedure citire;
var
f : Text;
i : Integer;
begin
Assign(f, 'bsort.in'); Reset(f);
readln(f, N);
for i := 1 to N do
read(f, b[i]);
Close(f)
end;
 
procedure flip;
var
i : Integer;
begin
for i:=1 to N do
a[i] := b[i];
end;
 
var p : pointer;
 
procedure bsort; assembler;
asm
{ les <=> es = seg(p), di = offset(p) }
les di, p
@do_while_not_ok :
mov dx, 1
mov cx, N
dec cx
mov ax, es:[di]
push di
@inner_for :
mov bx, ax
add di, 2
mov ax, es:[di]
cmp bx, ax
jbe @if_not
xchg bx, ax
mov es:[di], ax
mov es:[di-2], bx
xor dx, dx
@if_not :
dec cx
jnz @inner_for
pop di
or dx, dx
jz @do_while_not_ok
end;
 
procedure bsort2;
var
ok : Boolean;
i, aux : Integer;
begin
repeat
ok := true;
for i := 1 to n-1 do
if (a[i] > a[i+1]) then
begin
aux := a[i];
a[i] := a[i+1];
a[i+1] := aux;
ok := false;
end;
until ok;
end;
 
var
i : Integer;
starttick, endtick : LongInt;
time : Longint absolute $0000:$046C;
 
{ timer pentru masurarea timpului }
const tickspersecond = 18.206;
 
procedure starttimer;
begin
starttick := time;
end;
 
function elapsedtime : real;
begin
endtick := time;
elapsedtime := (endtick - starttick)*
(1 / tickspersecond);
end;
 
begin
citire;
p := @a;
 
starttimer;
for i:=1 to n_tests do
begin
flip;
bsort;
end;
writeln(n_tests, ' rulari ale bsort in asamblare
au rulat in : ', elapsedtime : 6:3, ' secunde');
 
starttimer;
for i:=1 to n_tests do
begin
flip;
bsort2;
end;
writeln(n_tests, ' rulari ale bsort obisnuit
 
au rulat in : ',
elapsedtime : 6:3, ' secunde');
end.
 
Output program pascal (pe pc-ul meu: Duron 750 Mhz):
100 rulari ale bsort in asamblare au rulat in : 1.263 secunde
100 rulari ale bsort obisnuit au rulat in : 4.614 secunde
 
De precizat este ca nu am optimizat programul aproape deloc (am transcris codul din pascal in asm). Cu optimizari "hardcore" se pot obtine timpi mult mai buni. Diferenta dintre varianta asm si varianta high level language este mai mica pe compilatoarele mai noi, cum ar fi GCC sau FreePascal deoarece acestea stiu genera un cod mai optimizat. Totusi, nici un compilator nu poate bate creierul uman.
 
 
 
 
 
Linkuri
 
[1]http://www.arl.wustl.edu/~lockwood/class/cs306/books/
 
artofasm/toc.html
 
 
 
Cartea "The Art of Assembly Language Programming". Este detaliata. Foarte buna atat pentru incepatori cat si pentru avansati.
 
[2]http://www.goof.com/pcg/doc/pentopt.txt
 
 
 
Un tutorial bun pentru optimizarea programelor in asamblare pentru procesoarele din familia Pentium. Tutorialul este pentru avansati.
 
[3]http://www.techtutorials.info/assembly.html
 
 
 
Mai multe tutoriale despre assembly language.
 
Doua cuvinte conclusive...
 
Acest articol trateaza "bazele" programarii in asamblare, dupa cum ii zice numele este doar o introducere. Pentru a sti sa programezi in asm, trebuie invatate mult mai multe lucruri. Scopul articolului este de a starni interesul cititorilor si de a le oferi o imagine asupra acestui limbaj. Cei ce doresc sa invete mai multe despre assembly language sunt invitati sa citeasca cartile / tutorialele din sectiunea linkuri.
 
References
 
Visible links
1. http://www.arl.wustl.edu/%7elockwood/class/cs306/books/artofasm/toc.html
2. http://www.goof.com/pcg/doc/pentopt.txt
3. http://www.techtutorials.info/assembly.html
 
 
Registrii de uz general sunt folositi

Nu exista diferente intre securitate.

Topicul de forum nu a fost schimbat.