Estructura de un programa en lenguaje ensamblador.

ensamblador
Pues llegados a este punto debemos prestar mucha atención pues aquí ya vamos llegando a la parte práctica, ya que las lecciones anteriores son importantes para conocer el funcionamiento de Assembler y para saber como se comunica con las máquinas,
pero los conceptos que se detallan a continuación son imprescindibles para aprender a manejar los programas que se usan en la ingeniería inversa y aprender a desensamblar los programas, para ello deberemos asimilar bien los siguientes puntos y las funciones principales de Assembler. No os preocupeis, porque al final del curso haré un resumen con lo más importante para que nadie se me despiste.

Palabras reservadas

Ciertas palabras en lenguaje ensamblador están reservadas para sus propósitos propios, y son usadas solo bajo condiciones especiales. Por categorías, las palabras reservadas incluyen:

• Instrucciones, como MOV y ADD, que son operaciones que la computadora puede ejecutar.
• Directivas como END o SEGMENT, que se emplean para proporcionar comandos al ensamblador.
• Operadores, como FAR y SIZE, que se utilizan en expresiones.
• Símbolos predefinidos, como @Data y @Model, que regresan información a su programa.
• El uso de una palabra reservada para un propósito equivocado provoca que el ensamblador genere un mensaje de error.
Ver palabras reservadas.

Identificadores Un identificador es un nombre que se aplica a elementos en el programa. Los dos tipos de identificadores son: nombre, que se refiere a la dirección de un elemento de dato. y etiqueta, que se refiere a la dirección de una instrucción. Las mismas reglas se aplican tanto para los nombres como para las etiquetas. Un identificador puede usar los siguientes caracteres:

1.- Letras del alfabeto: Desde la A hasta la Z
2.- Dígitos: Desde el 0 al 9 (no puede ser el primer carácter)
3.- Caracteres especiales Signo de interrogación ( ? )
Subrayado ( _ )
Signo de pesos ( $ )
Arroba ( @ )
Punto ( . ) (no puede ser el primer carácter)

El primer carácter de un identificador debe ser una letra o un carácter especial, excepto el punto. Ya que el ensamblador utiliza algunos símbolos especiales en palabras que inician con el símbolo @, debe evitar usarlo en sus definiciones.
El ensamblador trata las letras mayúsculas y minúsculas como iguales. La longitud máxima de un identificador es de 31 caracteres (247 desde el MASM 6.0). Ejemplos de nombres validos son COUNT, PAGE25 y $E10. Se recomienda que los nombres sean descriptivos y con significado. Los nombres de registros, como AX, DI y AL, están reservados para hacer referencia a esos mismos registros. En consecuencia, en una instrucción tal como:
ADD AX, BX
el ensamblador sabe de forma automática que AX y BX se refieren a los registros. Sin embargo, en una instrucción como:
MOV REGSAVE, AX

El ensamblador puede reconocer el nombre REGSAVE solo si se define en algún lugar del programa.

Instrucciones

Un programa en lenguaje ensamblador consiste en un conjunto de enunciados. Los dos tipos de enunciados son:
1. Instrucciones, tal como MOV y ADD, que el ensamblador traduce a código objeto.
2. Directivas, que indican al ensamblador que realiza una acción especifica, como definir un elemento de dato.
A continuación esta el formato general de un enunciado, en donde los corchetes indican una entrada opcional:

[identificador] operación [operando(s)] [;comentarios]

Un identificador (si existe), una operación y un operando (si existe) están separados por al menos un espacio en blanco o un carácter tabulador. Existe un máximo de 132 caracteres en una línea (512 desde el MASM 6.0), aunque la mayoría de los programadores prefiere permanecer en los 80 caracteres ya que es el numero máximo que cabe en la pantalla. A continuación se presentan dos ejemplos de enunciados:

IDENTIFICADOR OPERACION OPERANDO COMENTARIO
Directiva: COUNT DB 1 ;Nom, Op, Operando
Instrucción: MOV AX, 0 ;Operación, 2 Operand


Identificador, operación y operando pueden empezar en cualquier columna. Sin embargo, si de manera consistente se inicia en la misma columna para estas tres entradas se hace un programa mas legible.

• IdentificadorComo ya se explico, el termino nombre se aplica al nombre de un elemento o directiva definida, mientras que el termino etiqueta se aplica al nombre de una instrucción.


• OperaciónLa operación, que debe ser codificada, es con mayor frecuencia usada para la definición de áreas de datos y codificación de instrucciones. Para un elemento de datos, una operación como DB o DW define un campo, área de trabajo o constante.

• OperandoEl operando (si existe) proporciona información para la operación que actúa sobre el. Para un elemento de datos, el operando identifica su valor inicial. Por ejemplo, en la definición siguiente de un elemento de datos llamado COUNTER, la operación DB significa "definir byte", y el operando inicializa su contenido con un valor cero:




Para una instrucción, un operando indica en donde realizar la acción. Un operando de una instrucción puede tener una, dos o tal vez ninguna entrada. Aquí están tres ejemplos:





Directivas para listar page y title La directiva PAGE y TITLE ayudan a controlar el formato de un listado de un programa en ensamblador. Este es su único fin, y no tienen efecto sobre la ejecución subsecuente del programa.
PAGE. Al inicio de un programa, la directiva PAGE designa el numero máximo de líneas para listar en una pagina y el numero máximo de caracteres en una línea. Su formato general es:

PAGE [longitud][, ancho]

El ejemplo siguiente proporciona 60 líneas por pagina y 132 caracteres por línea:

PAGE 60, 132

El numero de líneas por pagina puede variar desde 10 hasta 255, mientras que el numero de caracteres por línea desde 60 hasta 132. La omisión de PAGE causa que el ensamblador tome PAGE 50, 80.


Title. Se puede emplear la directiva TITLE para hacer que un titulo para un programa se imprima en la línea 2 de cada pagina en el listado del programa. Puede codificar TITLE de una vez, al inicio del programa. Su formato general es:

TITLE Texto.

Para el operando texto, una técnica recomendada es utilizar el nombre del programa como se registra en el disco. Por ejemplo:

TITLE Prog1 Mi primer programa en ensamblador

Directiva segment Un programa ensamblado en formato .EXE consiste en uno o mas segmentos. Un segmento de pila define el almacén de la pila, un segmento de datos define los elementos de datos y un segmento de código proporciona un código ejecutable. Las directivas para definir un segmento, SEGMENT y ENDS tienen el formato siguiente:



El enunciado SEGMENT define el inicio de un segmento. El nombre del segmento debe estar presente, ser único y cumplir las convenciones para nombres del lenguaje. EL enunciado ENDS indica el final del segmento y contiene el mismo nombre del enunciado SEGMENT. El tamaño máximo de un segmento es de 64K. El operando de un enunciado SEGMENT puede tener tres tipos de opciones: alineación, combinar y clase, codificadas en este formato:

nombre SEGMENT alineación combinar ' clase '

Tipo alineación La entrada alineación indica el limite en el que inicia el segmento. Para el requerimiento típico, PARA, alinea el segmento con el limite de un párrafo, de manera que la dirección inicial es divisible entre 16, o 10H. En ausencia de un operando hace que el ensamblador por omisión tome PARA.

Tipo combinar. La entrada combinar indica si se combina el segmento con otros segmentos cuando son enlazados después de ensamblar. Los tipos de combinar son STACK, COMMON, PUBLIC y la expresión AT. Por ejemplo, el segmento de la pila por lo común es definido como:

nombre SEGMENT PARA STACK

Puede utilizar PUBLIC y COMMON en donde tenga el propósito de combinar de forma separada programas ensamblados cuando los enlaza. En otros casos, donde un programa no es combinado con otros, puede omitir la opción o codificar NONE.

Tipo clase La entrada clase, encerrada entre apóstrofos, es utilizada para agrupar segmentos cuando se enlazan. Se utiliza la clase 'code' para el segmento de códigos, 'data' por segmento de datos y 'stack' para el segmento de la pila. El ejemplo siguiente define un segmento de pila con tipos alineación, combinar y clase:

nombre SEGMENT PARA STACK 'Stack'

Directiva assume Un programa utiliza el registro SS para direccionar la pila, al registro DS para direccionar el segmento de datos y el registro CS para direccionar el segmento de código. Para este fin, usted tiene que indicar al ensamblador el propósito de cada segmento en el programa. La directiva para este propósito es ASSEME, codificada en el segmento de código como sigue:

OPERACION OPERANDO
ASSUME SS:nompila, DS:nomsegdatos, CS: nomsegcodigo,. . .

Los operandos pueden aparecer en cualquier orden. Al igual que otras directivas, ASSUME es solo un mensaje que ayuda al ensamblador a convertir código simbólico a código maquina; aun puede tener que codificar instrucciones que físicamente cargan direcciones en registros de segmentos en el momento de la ejecución.


1 PAGE 60,132
2 TITLE P04ASM1 ESTRUCTURA DE UN PROGRAMA .EXE
3;-------------------------------------------------------------------------------
4 STACKSG SEGMENT PARA STACK 'Stack'
5 ...
6 STACKSG ENDS
7;-------------------------------------------------------------------------------
8 DATASG SEGMENT PARA 'Data'
9 ...
10 DATASG ENDS
11;-------------------------------------------------------------------------------
12 CODESG SEGMENT PARA 'Code'
13 BEGIN PROC FAR
14 ASSUME SS:STACKSG, DS:DATASG,CS:CODESG
15 MOV AX, DATASG ;Obtiene la dirección del segmento de datos
16 MOV DS, AX ;Almacena dirección en DS
17 ...
18 MOV AX, 4C00H ;Peticion
19 INT 21H ;Salida al DOS
20 BEGIN ENDP
21 CODESG ENDS
22 END BEGIN


Directivas simplificadas de segmentos

Los ensambladores de Microsoft y de Borland proporcionan algunas formas abreviadas para definir segmentos. Para usar estas abreviaturas, inicialice el modelo de memoria antes de definir algún segmento. El formato general (incluyendo el punto inicial) es:

.MODEL modelo de memoria
El modelo de memoria puede ser TINY, SMALL, MEDIUM, COMPACT o LARGE. Los requisitos para cada modelo son:






Puede utilizar cualquiera de estos modelos para un programa autónomo (esto es, un programa que no este enlazado con algún otro). El modelo TINY esta destinado para uso exclusivo de programas .COM, los cuales tienen sus datos, código y pila en un segmento. El modelo SMALL exige que el código quepa en un segmento de 64K y los datos en otro segmento de 64K. La directiva .MODELL genera automáticamente el enunciado ASSUME necesario.
Los formatos generales (incluyendo el punto inicial) para las directivas que define los segmentos de la pila, de datos y de código son:

.STACK [tamaño]
.DATA
.CODE [nombre]

Cada una de estas directivas hace que el ensamblador genere el enunciado SEGMENT necesario y su correspondiente ENDS. Los nombres por omisión de los segmentos (que usted no tiene que definir) son STACK, DATA y TEXT (para el segmento de código).
La figura 4.3 proporciona un ejemplo haciendo uso de las directivas simplificadas de segmento.

page 60,132
TITLE P04ASM2 (EXE) Operaciones de mover y sumar
;-------------------------------------------------------------------------
.MODEL SMALL
.STACK 64 ;Se define la pila
.DATA ;Se definen los datos
FLDA DW 250
FLDB DW 125
FLDC DW ?
;-------------------------------------------------------------------------
.CODE ;Se define el segmento de código
BEGIN PROC FAR
MOV AX, @data ;Se asigna la dirección de DATASG (Prog. anterior)
MOV AX, FLDA ;Mover 0250 a AX
ADD AX, FLDB ;Sumar 0125 a AX
MOV FLDC, AX ;Almacenar suma en FLDC
MOV AX, 4C00H ;Salida a DOS
INT 21H
BEGIN ENDP ;Fin de procedimiento
END BEGIN ;Fin de programa

Fuente de consulta

1 comentario :