lunes, 11 de mayo de 2015

2.5 Elementos básicos: texto, vínculos, listas, tablas, objetos, imágenes y aplicaciones



2.5 Elementos básicos: texto, vínculos, listas, tablas, objetos, imágenes y aplicaciones
Dentro del documento hay dos zonas principales: el encabezamiento, delimitado por las marcas <HEAD> y </HEAD>, que sirve para definir algunos valores válidos para todo el documento, y el cuerpo, delimitado por las etiquetas <BODY> y </BODY>, donde reside la información del documento.
El elemento <TITLE> contenido dentro del encabezamiento permite especificar el título de un documento HTML. Este título no forma parte del documento en sí pues no se ve en la pantalla principal, sino que sirve como título de la ventana del programa que la muestra.
Existen muchos otros elementos que se engloban dentro del encabezamiento pero para la estructura básica del lenguaje HTML en su nivel básico no son necesarios.
El cuerpo de un documento HTML contiene el texto, imágenes, etc. que, con la presentación y los efectos que se decidan, se presentarán ante el usuario. Dentro del cuerpo se pueden aplicar una serie de efectos a través de diferentes marcas o etiquetas (también otros autores las denominan "directivas").

Así pues, la estructura de un documento HTML es la siguiente:
<HTML>
<HEAD>
<TITLE>Título de la página</TITLE>
</HEAD>
<BODY>
[Aquí se sitúan otras etiquetas que hacen posible visualizar la página]
</BODY>
</HTML>
El texto puede tener unas cabeceras, comprendidas entre las etiquetas <H1> y </H1>, <H2> y </H2>, etc. (hasta el número 6), siendo el número indicativo del tamaño. El tamaño mayor es el correspondiente al número 1.


Hay otras etiquetas como <P>, para separar los distintos párrafos, la etiqueta de centrado <CENTER> y </CENTER> que sirve para centrar todo lo que esté dentro de ella, ya sea texto, imágenes, etc. la etiqueta <HR> para obtener una raya horizontal tan ancha como la pantalla, y con la apariencia de estar embutida.


Los elementos básicos con los que cuenta un documento HTML, son el medio por el cual el usuario tiene interacción con la información, los elementos que son mas utilizados son;

• Vínculos
• Imágenes
• Objetos
• Aplicaciones
Algunas de las etiquetas que se utilizan para definir los elementos son; •
texto centrado
• texto subrayado •
Algunas de las etiquetas que se utilizan para definir los elementos son; •
texto centrado
• texto subrayado • • 
Algunas de las etiquetas que se utilizan para definir los elementos son;
texto centrado
• texto subrayado
Imagen de una ventana del Bloc de notas con distintas partes etiquetadas
• 
• 
Lineas

2.4 Estructura global de un documento


2.4 Estructura global de un documento

Un documento HTML 4 se compone de tres partes:
1. una línea que contiene información sobre la versión de HTML,
2. una sección de cabecera declarativa (delimitada por el elemento HEAD),
3. un cuerpo, que contiene el contenido real del documento. El cuerpo puede ser especificado mediante el elemento BODY o mediante el elemento FRAMESET.
Puede aparecer espacio en blanco (espacios, saltos de línea, tabulaciones y comentarios) antes y después de cada sección. Las secciones 2 y 3 deberían estar delimitadas por el elemento HTML.
Aquí tenemos un ejemplo de un documento HTML sencillo:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
<HTML>
<HEAD>
<TITLE>Mi primer documento HTML</TITLE>
</HEAD>
<BODY>
<P>¡Hola mundo!
</BODY>
</HTML>

La estructura básíca de un doumento html5 es
<!DOCTYPE html>
<html lang='es'>
<head>
  <meta charset='utf-8' />
  <title>Título de la página</title>
  <meta name='description' 
    content='Descripción de la página'>.
</head>
<body>
</body>
</html>

Creación de documentos HTML

  • Los documentos HTML son archivos de texto legibles ASCII con códigos de composición especiales embebidos o incorporados en el texto. Esto significa que los archivos HTML contienen letras, números, signos de puntuación, etc., más los códigos de composición HTML. Insistimos, se pueden leer o modificar directamente desde el bloc de notas.
  • Aunque no es obligatorio, es muy útil utilizar la extensión .html al archivar el documento HTML desde el bloc de notas. Así podrás saber luego de que tipo de documento se trata. Si utilizas un procesador de texto normal debes utilizar la opción Guardar como texto ASCII.
Aspecto de documentos HTML:
  • Lo que distingue a un archivo HTML de cualquier otro archivo de texto es la presencia de códigos de composición, denominados marcadores HTML. Estos códigos se incluyen en el documento y sirve para controlar el formato y la presentación del documento final. Los códigos también sirven para crear hipervínculos con otros documentos.
  • Los códigos de composición se acotan con unos caracteres especiales, que permiten diferenciarlos del texto del documento propiamente dicho. Estos símbolos son los corchetes angulares < y >. Estos códigos no distinguen entre mayúsculas y minúsculas aunque la normalización W3C indique que debemos usar minúsculas.
  • Los distintos navegadores muestran sus documentos de formas distintas: varía el color, el tipo de fuente, el tamaño, etc. Por lo tanto debes pensar en tu documento como una entidad lógica y no física, reconociendo que el aspecto físico puede variar de un visor a otro y de un PC a otro. Por ejemplo, si introduces tipos de letra especiales (que se salgan de los corrientes que tienen todos los PCs, en Arial, Courier, Times o Helvetica) dentro de tu página web, cuando alguien la "vea" en Internet, visualizará esos tipos de letra si están instalados en su PC, si no los verá con el tipo de letra que tenga cargado por defecto en su navegador.

Marcadores o etiquetas HTML obligatorios:

  • Marcador <html>: todos y cada uno de los documentos HTML deben empezar y terminar con este marcador que sirve para indicar que se trata de un documento HTML. En el marcador de cierre es obligatoria la barra inclinada (/html).
    En html 5 la prímera línea es <!DOCTYPE html>
  • Marcador <head>: los documentos HTML se dividen en dos partes, la cabecera y el cuerpo. Los navegadores Web necesitan distinguir entre cabecera y cuerpo para poder interpretar correctamente los documentos. En general la cabecera del documento (head) incluye la información general sobre el documento. Este marcador tienen su marcador de terminación con la barra inclinada (/head).
  • Marcador <body>: incluye el contenido real del documento (body o cuerpo). Este marcador tiene también su marcador de terminación con la barra inclinada </body>.

Cabecera del documento

Contiene información general sobre el documento HTML. Es obligatorio incluir el marcador <title>, el resto de los marcadores son opcionales.
Marcador <title>
Los navegadores muestran el título de cada uno de los documentos HTML que encuentran. El título que aparece se toma del contenido de este marcador. Este marcador debe aparecer con su pareja con la barra inclinada </title> y dentro de la sección<head>
<title>Esto es el título de la página</title>

Marcador <meta>

Las metatags son etiquetas html que se incorporan en el encabezado de una página web y que resultan invisibles para un visitante normal, pero de gran utilidad para navegadores u otros programas que puedan valerse de esta información.
Su propósito es el de incluir información (metadatos) de referencia sobre la página: autor, título, fecha, palabras clave, descripción, etc. Esta información podría ser utilizada por los robots de búsqueda para incluirla en las bases de datos de sus buscadores y mostrarla en el resumen de búsquedas o tenerla en cuenta durante las mismas y será invisible para un visitante normal.
Estas etiquetas también se usan para especificar cierta información técnica de la cual pueden valerse los navegadores para mostrar la página, como el grupo de caracteres usado, tiempo de expiración del contenido, posibilidad de dejar la página en cache o calificar el contenido del sitio ("programación web", "Oracle", etc.).
<html>
<head>
  <meta charset="utf-8">
  <title>html5</title>
</head>
<body>
  <p>Hola mundo desde el ITV</p>
</body>
</html>



FUENTES:

2.3 Tipos de datos básicos

2.3 Tipos de datos básicos

 El SGML permite definir nuevos metalenguajes. A cada lenguaje de formato de documentos definido con SGML se lo denomina aplicación SGML. Las partes en las que se divide una aplicación SGML son:
1. Una declaración SGML:
En la misma se concreta que caracteres y delimitadores pueden aparecer en la aplicación. Es decir, lo que se declara es la versión de caracteres que van a poder ser utilizados. (UTF-8 por ejemplo).
2. Una Declaración del tipo de documento (DTD):
Ésta define la sintaxis de las estructuras de formato, así como referencias a entidades de caracteres. En palabras más sencillas, define el tipo de etiquetas que van a poder ser usadas, los caracteres permitidos en el lenguaje, como se va a estructurar ese lenguaje etcétera… De esta manera se podrá luego validar frente a ese tipo de DTD seleccionada, para comprobar sin la sintaxis a la hora de coloras las balizas ha sido la correcta o tiene errores, sin embargo. Validar una web frente a la DTD empleada mediante el servicio del Validador de la W3C es algo imprescindible. De otra manera el comportamiento de nuestra web frente a los navegadores podría ser imprevisible, además de que afectaría al posicionamiento web, del cual hablaremos más adelante.
3. Una especificación que describe la semántica:
Se trata de una especificación que describe el significado que se debe aportar al código de formato. Adicionalmente, esta especificación también impone restricciones de sintaxis que no pueden expresarse dentro del DTD.
4. Documentos con su contenido y su marcado entrelazado:
Cada documento, como es lógico, debe contener una referencia al DTD que debe usarlo para interpretarlo. (Validación).
TIPOS DE DATOS BÁSICOS
La definición del tipo de documento especifica la sintaxis de los contenidos de los elementos y los valores de los atributos de HTML por medio de palabras (tokens) SGML (p.ej., PCDATA, CDATA, NAME, ID, etc.). Véase [ISO8879] para sus definiciones completas. Lo que sigue es un resumen de la información fundamental:
  • CDATA es una secuencia de caracteres tomados del conjunto de caracteres del documento y puede incluir entidades de caracteres. Los agentes de usuario deberían interpretar los valores de atributos como sigue:
    • Reemplazar las entidades de caracteres con caracteres,
    • Ignorar los avances de línea,
    • Reemplazar cada retorno de carro o tabulación con un espacio simple.
    Los agentes de usuario pueden ignorar el espacio en blanco inicial o final de valores de atributos CDATA (p.ej., ”   mivalor   ” puede interpretarse como “mivalor”). Los autores no deberían declarar valores de atributos con espacios en blanco al principio o al final.
    Para algunos atributos de HTML 4 con valores de atributo CDATA, la especificación impone restricciones más fuertes al conjunto de valores legales para el atributo, restricciones que no pueden expresarse por el DTD.
    Aunque los elementos STYLE y SCRIPT usan CDATA para su modelo de datos, para estos elementos los agentes de usuario deben tratar CDATAde manera diferente. El código y las entidades deben tratarse como texto sin formato y pasarse a la aplicación tal y como están. La primera aparición de la secuencia de caracteres “
  • Las palabras ID NAME deben comenzar con una letra ([A-Za-z]) que puede estar seguida por un número cualquiera de letras, dígitos, ([0-9]), guiones (“-“), subguiones (“_”), dos puntos (“:”), y puntos (“.”).
  • IDREF IDREFS son referencias a palabras ID definidas por otros atributos. IDREF es una palabra simple e IDREFS es una lista de palabras separadas por espacios.
  • Las palabras NUMBER deben contener al menos un dígito ([0-9]).

Cadenas de texto

Ciertos atributos (%Text; en el DTD) toman por valor un texto que se supone debe ser “legible por humanos”. Para información preliminar sobre atributos, consulte la parte del tutorial sobre atributos.

Colores

El tipo de valor de atributo “color” (%Color;) se refiere a las definiciones de colores según se especifican en [SRGB]. Un valor de color puede ser o bien un número hexadecimal (anteponiendo un signo “#”) o uno de los siguientes dieciséis nombres de colores. En los nombres de colores no se distingue entre mayúsculas y minúsculas.
Nombres de colores y valores sRGB
Black = “#000000″ (Negro)Green = “#008000″ (Verde)
Silver = “#C0C0C0″ (Plateado)Lime = “#00FF00″ (Verde lima)
Gray = “#808080″ (Gris)Olive = “#808000″ (Verde oliva)
White = “#FFFFFF” (Blanco)Yellow = “#FFFF00″ (Amarillo)
Maroon = “#800000″ (Marrón)Navy = “#000080″ (Azul marino)
Red = “#FF0000″ (Rojo)Blue = “#0000FF” (Azul)
Purple = “#800080″ (Púrpura)Teal = “#008080″ (Azul verdoso)
Fuchsia = “#FF00FF” (Fucsia)Aqua = “#00FFFF” (Celeste)


 Notas sobre el uso de colores

Aunque los colores pueden añadir cantidades significativas de información a los documentos y hacerlos más legibles, considere las siguientes pautas cuando incluya color en sus documentos:
  • El uso de elementos y atributos HTML para especificar colores estádesaprobado. Se aconseja utilizar hojas de estilo en su lugar.
  • No utilice combinaciones de colores que puedan causar problemas a personas con dificultades para distinguir colores.
  • Si usa una imagen de fondo o establece un color de fondo, asegúrese de que establece también los colores de los distintos textos.
  • Los colores especificados con los elementos BODY y FONT y conbgcolor en las tablas tienen apariencias diferentes en plataformas diferentes (p.ej., estaciones de trabajo, Macs, Windows, y paneles LCD frente a CRTs), por lo que no debería basar un efecto específico completamente en ellos. En el futuro, el soporte del modelo de color[SRGB] junto con los perfiles de color ICC debería mitigar este problema.
  • Cuando sea posible, adopte las convenciones comunes para evitar confusiones.

Longitudes

HTML especifica tres tipos de valores de longitud para los atributos:
  1. Píxeles (Pixels): El valor (%Pixels; en el DTD) es un entero que representa un número de píxeles del lienzo (papel, pantalla). Así, el valor “50” significa cincuenta píxeles. Para información normativa sobre la definición de un píxel, consulte [CSS1].
  2. Longitud (Length): El valor (%Length; en el DTD) puede ser o bien un %Pixel; o bien un porcentaje del espacio horizontal o vertical disponible. Así, el valor “50%” significa la mitad del espacio disponible.
  3. Multilongitud (MultiLength): El valor (%MultiLength; en el DTD) puede ser un %Length; o una longitud relativa . Una longitud relativa tiene la forma “i*”, donde “i” es un entero. Los agentes de usuario, cuando reparten espacio entre los elementos que compiten por ese espacio, adjudican primero las longitudes en píxeles y en porcentajes, y después dividen el espacio sobrante entre las longitudes relativas. Cada longitud relativa recibe una porción del espacio disponible que es proporcional al entero que precede al “*”. El valor “*” es equivalente a “1*”. Así, si hay disponibles 60 píxeles de espacio después de haber adjudicado el agente de usuario el espacio en píxeles y en porcentajes, y las longitudes relativas que deben asignarse son “1*”, “2*” y “3*”, se asignarán 10 píxeles al 1*, 20 píxeles al 2* y 30 píxeles al 3*.
Los valores de longitud son neutros frente a la distinción entremayúsculas y minúsculas.

Tipos de contenido (tipos MIME)

Nota. Un “media type” o “tipo de medios” (definido en [RFC2045] y [RFC2046]) especifica la naturaleza de un recurso vinculado. Esta especificación emplea el término “content type” (“tipo de contenido”) en lugar de “media type” (tipo de medios) de acuerdo con el uso actual. Además de esto, en esta especificación, “media type” se puede referir a los medios en que un agente de usuario representa un documento.
Este tipo está representado en el DTD por %ContentType;.
Los tipos de contenido no hacen distinción entre masyúculas y minúsculas.
Ejemplos de tipos de contenido son “text/html”, “image/png”, “image/gif”, “video/mpeg”, “text/css”, y “audio/basic”. Para la lista de tipos MIME registrados, consulte [MIMETYPES].

Fechas y horas

La [ISO8601] permite muchas opciones y variaciones en la representación de fechas y horas. La especificación actual usa uno de los formatos descritos en el perfil [DATETIME] para la definición de cadenas fecha/hora legales (%Datetime; en el DTD).


FUENTES:
http://html.conclase.net/w3c/html401-es/types.html

https://www.youtube.com/watch?v=W4DY3ZspLC4

2.2 Representación de documentos

2.2 Representación de documentos

• De presentación:
– Indica el formato del texto (información para el maquetado).
• De procedimientos:
– Orientado también a la presentación pero, en este caso, se indican los procedimientos que deberá realizar el SW de representación.
• Descriptivo o semántico:
– Describen las diferentes partes en las que se estructura el documento pero sin
especificar cómo deben representarse.

Los lenguajes de marcas, también denominados lenguajes de marcado o lenguajes de descripción de documentos, construyen un conjunto de reglas que definen todo aquello que es parte de un documento digital, pero que no pertenece al texto del mismo. Los lenguajes de marcas no son lenguajes de formato similares a los lenguajes que se usan enInternet como los de descripción de páginas (archivos PostScript,archivos .pdf, etc.) ni son lenguajes de  programación (JavaPerl, C++…), sino que se trata de lenguajes orientados a definir la estructura y la semántica de un documento. En realidad, más que de lenguajes, podríamos hablar de metalenguajes o sistemas formales mediante los cuales se añade información o codificación a la forma digital de un documento bien para controlar su procesamiento, bien para representar su significado.
En un documento existen distintos niveles de información: por un lado, los datos que conforman el contenido de un documento (caracteres de contenido), y por otro, una información superpuesta al contenido, que es lo que constituye el etiquetado, marcado o “markup” (caracteres de etiquetado).
Un lenguaje de marcado cumple con dos objetivos esenciales a la hora dediseñar y procesar un documento digital :
  •  Especifica las operaciones tipográficas y las funciones que debe ejecutar el programanavegador/visualizador sobre dichos elementos. Las operaciones tipográficas son instrucciones de formato que se aplican a cada uno de los elementos de undocumento digital como, por ejemplo, imprimir un título en negrita y a un determinado tamaño.
  •  Separa un texto en los elementos de los que se compone, como por ejemplo un párrafo, un capítulo, un encabezamiento, etc. 
Así, pues, hay 2 tipos de marcación:
  •  específica: describe cómo ha de formatearse el documento: fuente, tamaño, color, etc.
  •  estructural: describe la estructura del documento: titular, párrafo, etc.
En general los lenguajes de marcado siguen una sintaxis basada en el uso de marcas o etiquetas: una etiqueta que indica el principio de un elemento y otra el final del mismo.
Por regla general, la mayor parte de autores distinguen 2 tipos básicos de lenguajes de marcado:
  •  Lenguaje de marcado de procedimiento o procesado: Las anotaciones o marcas de los lenguajes de procedimiento describen la forma y el significado de las operaciones tipográficas que van a ser aplicadas a cada uno de los elementos del documento. Por ejemplo, una regla de un lenguaje de procedimiento indicaría que el título de la sección de un texto debe ser impreso en una sola línea con una fuente de seis puntos más grande que el resto del texto, con objeto de que los lectores puedan inferir que es el título. Se refiere, pues, a la apariencia física o formato (fuente, estilo de letra, tamaño, etc.) tanto del documento en pantalla como del documento impreso.
  •  Lenguaje de marcado estructural o descriptivo: En los lenguajes estructurales las marcas o anotaciones únicamente describen la estructura lógica del documento digitaly/o la descripción del contenido, no su tipografía.
Aunque lo cierto es que existen 3 utilizaciones básicas de los lenguajes de marcas: los que sirven principalmente para describir el contenido (por ejemplo, las bases de datos), los que sirven para definir el formato (por ejemplo, los procesadores de textos) y los que realizan las dos funciones indistintamente (por ejemplo, el lenguaje HTML).