T
o
n
o Revist
a
Técnic
a
de l
a
E
mp
r
es
a
de Telecomunic
a
ciones de Cu
ba
S
.A.
51
L
a humanidad siemp
r
e ha tenido especial interés por
las
r
ep
r
esentaciones visuales g
r
á
cas debido a la cla-
r
idad espacial que b
r
indan y al volumen de in
f
o
r
mación que
contienen, lo que pe
r
mite que la mente p
r
ocese con mayor
r
apidez,
r
econozca las ca
r
acte
r
ísticas esenciales de la infor-
mación y
r
ealice impo
r
tantes p
r
ocesos de in
f
e
r
encia. En la
actualidad, este campo está muy
r
elacionado con la compu-
tación g
r
á
ca.
En este ma
r
co pod
r
ían ubica
r
se los mapas autoorganiza-
dos, los cuales b
r
indan excepcionales posibilidades para el
descub
r
imiento de in
f
o
r
mación no t
r
ivial. No obstante, en
ocasiones el desconocimiento tácito de sus ca
r
acterísticas
lleva a un uso inadecuado y, en consecuencia, a la obten-
ción de
r
esultados incong
r
uentes, de
f
o
r
mados e insu
cien-
tes, mayo
r
ita
r
iamente t
r
iviales que deme
r
itan las
v
erdaderas
potencialidades de estas técnicas pa
r
a el descub
r
imiento de
in
f
o
r
mación.
M
i
n
e
r
í
a
de
d
a
t
o
s
El total de datos acumulados dia
r
iamente a nivel mundial
es del o
r
den de miles de te
r
abytes, po
r
lo que se puede inferir
la cantidad almacenada en sopo
r
tes in
f
o
r
máticos por la hu-
manidad. Estos datos pueden tene
r
un mejo
r
o peor destino
según cómo se almacenen y/o p
r
ocesen, teniendo en cuenta
las disímiles tecnologías y medios de almacenamiento exis-
tentes.
En la última década, han ganado auge nuevas co
r
rientes del
pensamiento
r
especto al alisis de los datos y la producción
de he
rr
amientas digitales en co
rr
espondencia con esas necesida-
des, de ahí han su
r
gido cnicas especialmente diseñadas para el
descub
r
imiento del conocimiento dent
r
o de ma
r
eas de datos que
apa
r
entemente no exp
r
esan nada.
P
o
r
L
i
c
.
A
l
d
o
L
.
G
u
e
rr
a
P
u
li
d
o,
E
s
pe
c
i
a
li
st
a
B
e
n
T
e
l
e
m
á
t
i
c
a
,
I
ng
.
M
a
r
i
o
L
.
B
a
s
u
l
t
o
N
úñ
e
z
,
E
s
pe
c
i
a
li
st
a
P
r
i
n
c
i
p
a
l
,
I
ng
.
E
r
a
s
m
o
G
o
v
í
n
T
e
j
e
r
a
,
J
G
r
u
p
o,
D
p
t
o
.
S
i
st
e
m
a
O
pe
r
a
t
i
v
o,
CDNT
,
E
T
E
CS
A
,
y
L
i
c
.
A
n
a
be
l
B
a
s
u
l
t
o
C
a
s
a
s
,
I
n
st
r
u
c
t
o
r
a
,
M
o
de
r
a
d
o
r
a
de
E
c
u
R
ed
,
P
a
l
a
c
i
o
C
e
n
t
r
a
l
de
C
o
m
p
u
t
a
-
c
i
ó
n
,
M
E
S
.
a
l
d
o
.
gu
e
rr
a
@
e
t
e
c
s
a
.
c
u
,
m
a
r
i
o
.
b
a
s
u
l
t
o
@
e
t
e
c
s
a
.
c
u
,
e
r
a
s
m
o
.
g
o
v
i
n
@
e
t
e
c
s
a
.
c
u
,
a
n
a
be
l
.
b
a
s
u
l
t
o
@
j
o
ve
n
c
l
u
b
.
c
u
U
s
o adecuado
de lo
s
mapa
s
au
t
oorganizados
para el
de
s
cubrimiento
d
e
in
f
ormación
I
n
t
r
o
d
u
cc
i
ó
n
52
To
n
o Revist
a
Técn
i
c
a
de
la
E
mpres
a
de Te
l
ecomunic
a
ciones de Cub
a
S.
A
.
Una de e
s
ta
s
corriente
s
e
s
la minería de datos
(
MD
)
que
aplica una gran variedad de metodología
s
y he
rr
amientas
para “exprimir” y entender lo
s
dato
s
, ademá
s
de apo
r
ta
r
r
e
-
s
ultado
s
en ca
s
i todo
s
lo
s
campo
s
del
s
aber humano.
P
re
s
tigio
s
a
s
empre
s
a
s
en el mundo, en
s
u afán de mejo
r
a
r
e incrementar
s
u
s
produccione
s
y
s
ervicio
s
, han optado po
r
el “rie
s
go” de poner
s
u
s
dato
s
en mano
s
de especialistas en
minería de dato
s
e información, obteniendo
r
esultados es
-
pectaculare
s
en cuanto al de
s
cubrimiento de in
f
o
r
mación
no trivial implícita en la madeja de ba
s
e
s
de datos, páginas
Web, imágene
s
, manu
s
crito
s
,
s
ecuencia
s
de tiempo, tenden
-
cia
s
nanciera
s
, etc. E
s
te hecho le
s
ha permitido
r
eo
r
ienta
r
,
en mucho
s
ca
s
o
s
, el cur
s
o de lo
s
acontecimientos o viabiliza
r
la obtención de ganancia
s
neta
s
millonaria
s
al pode
r
enten
-
der mejor lo
s
dato
s
.
R
ede
s
n
e
u
r
o
n
a
l
e
s
a
r
t
i
f
i
c
i
a
l
e
s
Dentro de la
M
D
s
e agrupan diver
s
o
s
tipo
s
de algo
r
itmos
como lo
s
modelo
s
de rede
s
neuronale
s
, la
s
que tienen ent
r
e
s
u
s
virtude
s
la capacidad del aprendizaje y, po
r
tanto, de me
-
jorar
s
u funcionamiento. A partir de lo
s
e
s
tudios
r
ealizados
acerca del
s
i
s
tema nervio
s
o del cerebro, el homb
r
e ha c
r
eado
modelo
s
de rede
s
neuronale
s
arti
ciale
s
(RNA) pa
r
a
r
esolve
r
problema
s
de cierta complejidad, donde cada neu
r
ona sin
-
toniza o aprende por
s
í mi
s
ma a reconocer u
n
dete
r
minado
tipo de patrón de entrada. La
s
RNA con
s
tituyen modelos de
aprendizaje y proce
s
amiento automático. Conceptualmente
s
e de
nen como un
s
i
s
tema de interconexión de neu
r
onas
en una red que colabora para producir un e
s
tímulo de salida.
En general, con
s
i
s
ten en la
s
imulación de la
s
p
r
opiedades
ob
s
ervada
s
en lo
s
s
i
s
tema
s
neuronale
s
bioló
g
icos a t
r
avés
de modelo
s
matemático
s
recreado
s
mediante mecanismos
arti
ciale
s
, cuyo objetivo e
s
con
s
eguir que la
s
máquinas den
re
s
pue
s
ta
s
s
imilare
s
a la
s
que puede dar el ce
r
eb
r
o, que se
caracterizan por
s
u generalización y robu
s
tez.
Lo
s
modelo
s
de rede
s
neuronale
s
arti
ciale
s
s
e pueden cla
-
s
i
car de la
s
iguiente forma [1]:
La impo
r
tancia del desa
rr
ollo de la técnica de las redes neu-
r
onales a
r
ti
ciales
r
adica en su compo
r
tamiento útil al apren-
de
r
,
r
econoce
r
y aplica
r
r
elaciones ent
r
e objetos y tramas de
objetos p
r
opios del mundo
r
eal.
M
a
p
a
s
a
u
t
oo
r
g
a
n
i
z
a
d
o
s
Los mapas autoo
r
ganizados —también con
o
cidos por las
siglas
S
OM, del inglés Self
-
Organizing
M
ap
s
son redes
neu
r
onales no supe
r
visadas con una técnica de proyección
no lineal que muest
r
a datos de alta dimensión en una rejilla
de dos dimensiones con dos capas de neu
r
onas, una de entra-
da y ot
r
a de p
r
ocesamiento. Las neu
r
onas de la primera capa
se limitan a
r
ecoge
r
y canaliza
r
la in
f
o
r
mació
n
. La segunda
capa se conecta a la p
r
ime
r
a a t
r
avés de pesos sinápticos, pre-
se
r
vando las ca
r
acte
r
ísticas esenciales de los datos en forma
de
r
elaciones de vecindad.
Una
r
ed neu
r
onal no supe
r
visada evolucio
n
a durante su
ent
r
enamiento. El
S
OM es capaz de identi
car patrones en
nuevos datos una vez ent
r
enado.
Es opo
r
tuno destaca
r
que la in
f
o
r
mación que se represen-
ta ha sido sometida a un p
r
oceso de
lt
r
aje
p
revio, donde
se eliminan los
r
uidos, datos e
rr
óneos o puntos demasiado
alejados de la media, de mane
r
a que
r
esulte un proceso co-
he
r
ente.
Dent
r
o del contexto de los p
r
ocesos cognitivos del cerebro,
la
f
o
r
ma de situa
r
al ap
r
endizaje no supe
r
visado es conside-
r
ándolo semejante a los p
r
ocesos inconscientes, en los cua-
les cie
r
tas neu
r
onas del ce
r
eb
r
o ap
r
enden a
r
esponder a un
conjunto especí
co y
r
ecu
rr
ente de estímulos provenientes
del medio exte
r
no, de esta
f
o
r
ma se const
r
uye
n
los llamados
“mapas senso
r
iales” en el ce
r
eb
r
o.
F
i
gu
r
a
1
C
l
a
s
i
f
i
c
a
c
i
ó
n
de
m
o
de
l
o
s
n
e
u
r
o
n
a
l
e
s
(
F
u
e
n
t
e
:
[
1
]
)
.
F
i
gu
r
a
2
R
ep
r
e
s
e
n
t
a
c
i
ó
n
de
un
a
r
ed
n
e
u
r
o
n
a
l
SO
M
de
d
o
s
d
i
m
e
n
s
i
o
n
e
s
(
t
o
p
o
l
o
g
í
a
r
e
c
t
a
ngu
l
a
r
)
(
F
u
e
n
t
e
:
[
2
]
)
.
T
o
n
o Revist
a
Técnic
a
de l
a
E
mp
r
es
a
de Telecomunic
a
ciones de Cu
ba
S
.A.
53
cione
s
matemática
s
, ya que e
s
po
s
ible de
s
cubri
r
pat
r
ones
ine
s
perado
s
por
su
capacidad de pre
s
entar automáticamente
un mapa en el cual
s
e puede ob
s
ervar una de
s
cripción de la
s
imilitud entre lo
s
dato
s
.
La
s
técnica
s
S
OMine pre
s
entan y combinan dife
r
entes en
-
foque
s
de la minería de dato
s
por lo que
s
on capaces de lee
r
formato
s
de text
os
, de Excel,
SPSS
, etc., con la habilidad
de proce
s
ar centenare
s
de mile
s
de regi
s
tro
s
con cientos de
variable
s
.
Lo
s
S
O
M
po
s
een una gran cantidad de aplicaci
o
nes técni
-
ca
s
, por ejemplo:
Reducción de dimen
s
ione
s
Cla
s
i
cacn de patrone
s
Cuanti
cación vectorial
M
inería de dato
s
exploratorio
s
M
inería de te
x
to
s
M
inería Web
Extracción de ra
s
go
s
Tratamiento y reconocimiento de imágene
s
Interpolación de una función
Análi
s
i
s
e
s
tadí
s
tico
Clu
s
tering (Agrupamiento)
M
etáfora
s
visuale
s
Por lo que tienen un amplio abanico de aplicaciones p
r
ácti
-
ca
s
en diver
s
a
s
área
s
:
P
er
le
s
de mercado y cliente
s
Cada neurona está repre
s
entada por un vector pr
o
totipo, es
Análisis de ma
r
keting y
nanzas
decir, un vector de pe
s
o n-dimen
s
ional.
I
nvestigaciones biológicas
El proce
s
o de aprendizaje de un mapa autoorganizado se
I
nvestigaciones ast
r
onómicas
p
u
ede dividir en tre
s
fa
s
e
s
:
I
nvestigaciones clínicas y médicas
1ra fa
s
e: Competitiva, en la que
s
e determina la neu
-
Análisis sociales
rona ganadora, e
s
decir, la mejor emparejada con el pa
-
I
nteligencia de negocios
trón de entrada
s
egún la di
s
tancia euclidiana.
Pr
ocesos de optimización
2da fa
s
e: Cooperativa, e
s
tablecida en rminos de
Pr
ocesos de ingenie
r
ía
una función de vecindad entre la neurona ganado
r
a y
Análisis Web
la
s
demá
s
.
Catego
r
ización de documentos
3ra fa
s
e: Adaptativa, que actualiza lo
s
vect
or
es si
-
Cont
r
ol de movimientos
r
obóticos
náptico
s
de la unidad ganadora y
s
u
s
vecina
s
s
en la
Monito
r
ización de p
r
ocesos
regla de aprendizaje.
Metá
f
o
r
as geog
r
á
cas
El re
s
ultado del proce
s
o de formación e
s
una ag
r
upación
Pr
obablemente éstas sean, junto con el
P
erceptrón
vi
s
ual que mue
s
tra la
s
s
imilitude
s
y diferencia
s
en los datos.Multicapa, las
r
edes neu
r
onales más usadas.
De
s
de la per
s
pectiva de la
s
egmentación, lo
s
SO
M tienenEste t
r
abajo abo
r
da, en pa
r
ticula
r
, el empleo del
s
istema de
varia
s
ventaja
s
e
n
comparación con lo
s
métodos de opti
-
so
f
twa
r
e Viscove
r
y
S
OMine
(
V
S
OM
)
, desa
rr
ollado por la
rma
mización matemático
s
y lo
s
enfoque
s
s
e
s
tadísticos. LaViscove
r
y
S
o
f
twa
r
e GMBH.
S
OMine es muy
f
ácil de usar e
principal e
s
que al
s
er un método altamente vi
s
ual,
f
acilita laincluye una se
r
ie de he
rr
amientas avanzadas de p
r
ocesamiento
explicación de los re
s
ultado
s
a lo
s
que toman la
s
decisiones.de datos y de p
r
e
-
análisis, tales como la ag
r
upación automati-
De hecho, re
s
ulta
s
intuitivo para un público sin inclina
-
zada del mapa basada en el método de ag
r
upamiento jerárquico
de Wa
r
d.
E
n
t
r
e
n
a
m
i
e
n
t
o
de
l
m
o
de
l
o
Viscove
r
y
S
OMine se basa en algo
r
itmos de ent
r
enamiento
y utiliza un p
r
og
r
esivo aumento del tamaño del mapa durante
el p
r
oceso de
f
o
r
mación, lo que hace que su implementación
sea muy e
ciente. A pesa
r
de que V
S
OM es bastante tolerante
con los datos
r
uidosos o pe
r
didos, el p
r
e
-
p
r
ocesamiento de los
datos es una pa
r
te impo
r
tante de la ta
r
ea de mine
r
ía de datos,
enca
r
gado de la ta
r
ea de ga
r
antiza
r
la calidad de los datos y
r
esolve
r
p
r
oblemas como datos vacíos, e
rr
óneos o atípicos.
P
a
r
a en
fr
enta
r
los datos atípicos, V
S
OM usa la transforma-
ción sigmoide que hace én
f
asis en los valo
r
es de tendencia
cent
r
al, con la consiguiente
r
educción de la in
ue
n
cia de los
valo
r
es ext
r
emos de ent
r
ada. También se usan adaptaciones
de va
r
ianza pa
r
a log
r
a
r
que las va
r
iables sean c
o
mparables
(
método de Wa
r
d
)
.
En gene
r
al, el tamaño del mapa depende
r
á del propósito
de la aplicación. Un mapa hexagonal g
r
ande es
b
ueno para
log
r
a
r
una visualización más p
r
ecisa del nivel de registro in-
dividual, mient
r
as que uno pequeño es más adecuado para el
ag
r
upamiento debido a su capacidad de comp
r
imir los datos
en una cantidad meno
r
de g
r
upos.
P
o
r
su pa
r
te, el tamaño del mapa de nodos se
s
elecciona
como un equilib
r
io ent
r
e la ag
r
upación y la visualización ya
que los g
r
upos pueden no se
r
muy homogéneos lo que posi-
bilita juzga
r
con p
r
ecisión las di
f
e
r
encias int
r
a
-
ag
r
upación.
54
To
n
o Revist
a
Técn
i
c
a
de
la
E
mpres
a
de Te
l
ecomunic
a
ciones de Cub
a
S.
A
.
de ten
s
n típico e
s
0,5 y, normalmente,
s
e u
s
a la
f
unción de
vecindad gau
ss
iana. En la agrupación de do
s
etapas, las neu
r
o
-
na
s
en el mapa ba
s
an el agrupado en
s
u
s
di
s
tancias euclidianas,
utilizando un algoritmo de agrupamiento adecuado. En muchos
ca
s
o
s
,
s
e utiliza el método jerárquico de Ward, incluido en el
s
oftware, para identi
car lo
s
grupo
s
en el mapa final.
No ob
s
tante, en oca
s
ione
s
, la minería de dato
s
,
p
o
r
su novedad,
tiene en contra el u
s
o inadecuado de
s
u
s
técnica
s
y
posibilidades
a
s
ociado al desconocimiento acerca del tema y a la ausencia de
la
s
metodología
s
apropiada
s
para
s
u implementación.
U
s
o
i
n
a
de
c
u
a
d
o
de
l
a
h
e
rr
a
m
i
e
n
t
a
V
SO
M
A vece
s
, a cau
s
a de método
s
inadecuado
s
pueden obtene
r
se mapas
autoorganizado
s
que, en realidad, no aportan conocimiento alguno.
E
s
te
s
i
s
tema
r
equiere poco
s
parámetro
s
de con
gu
r
ación. Enel eje X, lo que se
r
ía comp
r
ensible pa
r
a cualquier lector.
S
in
un inicio,
s
e p
u
ede aju
s
tar la ten
s
n pue
s
e
s
encialmente es unemba
r
go, se utiliza
r
on pa
r
a gene
r
a
r
un mapa autoorganizado
valor para el radio de la vecindad en la etapa
nal del ent
r
ena
-
usando Viscove
r
y
S
OMine que, independientemente de su
miento, donde lo
s
re
s
ultado
s
de ten
s
n baja ofrecen g
r
an deta
-
va
r
iedad de colo
r
es, apa
r
ece aho
r
a con un o
r
denamiento por
lle local (precisión), mientra
s
que lo
s
valore
s
altos de tensiónvalo
r
es de acue
r
do a cie
r
ta escala, sin que esto ofrezca clari-
tiene un efecto promedio (
s
uavizado)
s
obre el mapa. El valo
r
dad alguna sob
r
e la in
f
o
r
mación contenida en los datos.
T
a
b
l
a
1
E
j
e
m
p
l
o
c
o
n
l
o
s
v
a
l
o
r
e
s
nu
m
é
r
i
c
o
s
de
s
o
r
g
a
n
i
z
a
d
o
s
(
F
u
e
n
t
e
:
e
l
a
b
o
-
r
a
c
i
ó
n
p
r
o
p
i
a
)
.
E
s
to
s
mapa
s
s
uelen crear
s
e mediante algún procedimiento que ha
F
i
gu
r
a
3.
E
j
e
m
p
l
o
de
m
a
p
a
a
u
t
oo
r
g
a
n
i
z
a
d
o
(
F
u
e
n
t
e
:
e
l
a
b
o
r
a
c
i
ó
n
p
r
o
p
i
a
)
.
F
i
gu
r
a
4
U
n
m
a
p
a
t
e
m
á
t
i
c
o
de
C
u
b
a
(
F
u
e
n
t
e
:
e
l
a
b
o
r
a
c
i
ó
n
p
r
o
p
i
a
)
.
Como
s
e ob
s
erva en la tabla 1, hay un ordenamiento geo
-
grá
co por provincia
s
en el
s
entido de oe
s
te a este de Cuba,
mientra
s
que el municipio e
s
pecial I
s
la de la
J
uventud apa
-
rece al
nal.
E
s
to
s
dato
s
pudieron haber
s
e repre
s
entado mediante un
grá
co de columna
s
donde
s
e de
s
plegaran la
s
p
r
ovincias en
s
ido ejecutado en forma de trucaje, lo cual de
s
virtúa la esencia deEn la
gu
r
a 3 se hace muy di
f
ícil descub
r
i
r
conocimiento,
la herramienta V
S
O
M
. Tale
s
manejo
s
traen como consecuencia supues se t
r
ata de una
r
ep
r
esentación inadecuada a partir de
empleo en cue
s
tione
s
triviale
s
y en la generacn de
r
esultados po
-
datos que habían sido etiquetados de antemano, donde no se
bre
s
en calidad, lo que provoca la falta de inte
s
e incomp
r
ensión
r
evelan pat
r
ones inte
r
esantes ni se ap
r
ecian
r
elaciones que
por parte de lo
s
que toman deci
s
ione
s
, el rechazo de los escépticossalten a la vista; además, sólo se manejan 16
r
egistros. Como
y, en general, la
s
ube
s
timación de la
s
herramienta
s
S
OM.se expond
r
á más adelante, en este caso la estadística y mine-
A continuaci
ó
n
s
e repre
s
enta un mal procedimiento de o
r
dena
-r
ía de datos de V
S
OM han sido notablemente
s
ubutilizadas.
miento y pre
s
entación de lo
s
dato
s
, donde
s
e evide
n
cia que no e
r
aEl p
r
oceso en cuestión a
rr
ojó un mapa temático (
F
igura 4),
nece
s
ario el u
so
de V
S
O
M
.donde los datos
r
elacionados con el colo
r
f
ueron tomados
La
s
iguiente tabla pre
s
enta, a modo de ejemplo, un pequeño con
-
manualmente: se llevó la imagen del mapa autoorganizado
junto de dato
s
con valore
s
numérico
s
arbitrario
s
:hasta un so
f
twa
r
e de captu
r
a que b
r
inda el RGB de cada co-
lo
r
; luego, se inco
r
po
r
a
r
on a un sistema de gestión de mapas
temáticos, en especí
co el G
IS
Mapin
f
o; y, p
o
steriormente,
f
ue
r
on inse
r
tados en un mapa de Cuba.
P
o
r
último, se insertó
en la pa
r
te in
f
e
r
io
r
del mapa una copia de la escala de colores
de la
gu
r
a 3.
Los mapas temáticos están basados en mapas topográ
cos
que
r
ep
r
esentan cualquie
r
f
enómeno geog
r
á
c
o
de la super-
cie te
rr
est
r
e. Hacen
r
e
f
e
r
encia a la
r
ep
r
esentación de ciertas
ca
r
acte
r
ísticas de dist
r
ibución,
r
elación, densidad o regio-
nalización de objetos
r
eales vegetación, suelos, geología,
etc. o de conceptos abst
r
actos indicado
r
e
s
de violencia,
T
o
n
o Revist
a
Técnic
a
de l
a
E
mp
r
es
a
de Telecomunic
a
ciones de Cu
ba
S
.A.
55
de
s
arrollo económico, calidad de vida, etc.—, pero, eviden
-
temente, no
s
on producto de la aplicación de la mine
r
ía de
dato
s
.
La
s
herramienta
s
de
M
D del tipo
S
O
M
ine no deben uti
-
lizar
s
e para repre
s
entar mapa
s
temático
s
de forma di
r
ecta,
s
ería un error de concepto y una aguda
s
ubutilización de
r
e
-
cur
s
o
s
tan potente
s
. E
s
to
s
ca
s
o
s
s
iempre contienen p
r
oble
-
ma
s
mal planteado
s
.
No ob
s
tante,
s
ería factible que, de
s
pué
s
de hace
r
mine
r
ía
con e
s
ta
s
herramienta
s
, lo
s
re
s
ultado
s
s
ean rep
r
esentados
mediante
S
i
s
tema
s
de Información Geográ
ca, lo que impli
-
caría un correcto procedimiento y el con
s
ecuente escla
r
eci
-
miento del proce
s
o realizado.
En el ejemplo expue
s
to anteriormente, una
s
olució
n
s sim
-
ple, lógica y e
s
clarecedora podría
s
er ordenar lo
s
valo
r
es de ma
-
yor a menor y
s
emaforizarlo
s
s
egún cierto criterio de límites,
lo cual re
s
ulta mucho
s
vi
s
ual y compren
s
ible (Tabla 2
)
.
La
gu
r
a 5 muest
r
a el mapa
nal. La ag
r
upación está
compuesta po
r
diez g
r
upos de dive
r
sos tamaños, de C1 a
C10. El colo
r
de la ag
r
upación sólo signi
ca la pertenen-
cia al clúste
r
, sin implica
r
ningún valo
r
. El mapa
f
ue creado
de acue
r
do a las va
r
iables de las catego
r
ías descriptivas.
Con el objetivo de inte
r
p
r
eta
r
el mapa y, en pa
r
ticular, de
las ca
r
acte
r
ísticas de cada g
r
upo deben utiliza
r
se los planos
de los componentes de la
gu
r
a 6. Los planos componentes
muest
r
an la dist
r
ibución de los valo
r
es de las variables en
el mapa. Los valo
r
es de cada va
r
iable se
r
ep
r
esentan por el
colo
r
de la neu
r
ona: los colo
r
es cálidos
r
ojo, na
r
anja y am-
a
r
illo— muest
r
an valo
r
es altos y los colo
r
es
fr
ío
s
—azul—
muest
r
an los valo
r
es bajos. Los valo
r
es ap
r
oximados se
indican mediante la escala en cada plano componente. El
mapa es inte
r
p
r
etado po
r
la lectu
r
a de los planos de los com-
ponentes pa
r
a cada g
r
upo.
P
o
r
ejemplo, el G
r
upo 6 muestra
valo
r
es de medio a altos en la solvencia y el ROE, y valores
bajos en la edad, el volumen de negocios y el total del balance.
El G
r
upo 6 también muest
r
a dive
r
sos
f
acto
r
es de riesgo en
un
r
ango de bajo a alto, po
r
lo que puede concluirse que
son pequeñas emp
r
esas
r
elativamente jóvenes, aunque muy
r
entables. Asimismo, puede ve
r
se que el
f
acto
r
de riesgo es
elevado en los segmentos C2 y C5, lo que signi
ca que estos
contienen las compañías menos
ables. Las empresas más
antiguas se encuent
r
an en los segmentos C4, C5 y C7.
La
gu
r
a 6 muest
r
a los datos demog
r
á
cos por separado
de las emp
r
esas en estudio.
U
s
o
a
de
c
u
a
d
o
de
l
a
h
e
rr
a
m
i
e
n
t
a
V
SO
M
A continuación
s
e propone un ejemplo donde se utilizan
lo
s
dato
s
demográ
co
s
de un grupo de empre
s
a
s
f
acto
r
de
rie
s
go, edad,
s
olvencia, volumen de negocio
s
, cambio en
%
del volumen de negocio, balance general y ROE
(
Return on
Equity) para crear un mapa. Lo
s
re
s
ultado
s
de la segmenta
-
cn demográ
ca
s
e emparejaron con la informacn de ventas
T
a
b
l
a
2
E
j
e
m
p
l
o
c
o
n
l
o
s
v
a
l
o
r
e
s
nu
m
é
r
i
c
o
s
o
r
g
a
n
i
z
a
d
o
s
e
n
o
r
de
n
de
s
c
e
n
-
de
n
t
e
m
e
n
t
e
y
s
e
m
a
f
o
r
i
z
a
d
o
s
(
F
u
e
n
t
e
:
e
l
a
b
o
r
a
c
i
ó
n
p
r
o
p
i
a
)
.
F
i
gu
r
a
5
P
l
a
n
o
s
c
o
m
p
o
n
e
n
t
e
s
de
l
m
a
p
a
(
F
u
e
n
t
e
:
[
3
]
)
.
A
n
á
li
s
i
s
de
l
o
s
r
e
s
u
l
t
a
d
o
s
Los
r
esultados de la segmentación de clientes se
r
esumen en
la tabla 3, donde apa
r
ecen las dimensiones y las característi-
cas distintivas de cada uno de los conglome
r
ados. Las agrupa-
ciones C1, C2 y C3 son las s g
r
andes.
Los g
r
upos identi
cados son los siguientes:
Gr
up
o 1: El
f
acto
r
de
r
iesgo, la edad, el volumen
d
e nego-
cios y el balance gene
r
al son bajos, mient
r
as que la solvencia
oscila de medio a alto. El
r
endimiento sob
r
e el capital es bue-
no en p
r
omedio. Este g
r
upo también incluye a los clientes
para cada producto [3].
F
i
gu
r
a
6
P
l
a
n
o
s
c
o
m
p
o
n
e
n
t
e
s
de
l
m
a
p
a
(
F
u
e
n
t
e
:
[
3
]
)
.
56
To
n
o Revist
a
Técn
i
c
a
de
la
E
mpres
a
de Te
l
ecomunic
a
ciones de Cub
a
S.
A
.
R
e
f
e
r
e
n
c
i
a
s
b
i
b
li
o
g
r
á
f
i
c
a
s
[
1
]
A
r
i
a
s
S
.
,
F
r
a
n
c
is
co
J
a
v
i
e
r
.
R
e
d
e
s
N
e
u
r
o
n
a
l
e
s
A
r
t
i
f
i
c
i
a
l
e
s
.
2009
.
h
tt
p
:
//
e
s
.
s
c
r
i
bd
.
com
/
d
oc
/
78811085
/
M
a
p
-
A
s
k
-
O
h
-
o
n
-
E
n
(
a
cc
e
s
o
oc
t
u
b
r
e
15
,
2012
)
.
[
2
]
O
l
g
a
K
u
r
a
s
o
v
a
,
P
a
v
e
l
S
t
e
f
a
n
o
v
i
.
V
is
u
a
l
a
n
a
l
y
sis
of
s
e
l
f
-
o
r
g
a
n
i
z
i
n
g
m
a
p
s
.
N
on
li
n
e
ar
A
n
al
y
s
i
s
:
M
o
d
e
lli
n
g
a
n
d
C
on
t
r
o
l
,
v
o
l
.
16
,
n
o
.
4
(
d
i
c
i
e
m
b
r
e
,
2011
)
:
488
504
.
[
3
]
H
o
l
m
b
om
,
A
nn
i
k
a
H
.
;
E
k
l
un
d
,
T
om
a
s
;
a
n
d
B
a
c
k
,
B
a
r
b
r
o
,
C
u
s
t
om
e
r
P
o
r
t
fo
li
o
A
n
a
l
y
-
sis
U
si
n
g
t
h
e
SO
M
.
A
C
I
S
2008
P
r
o
c
ee
d
i
n
g
s
.
19
t
h
A
u
s
t
r
a
l
a
si
a
n
C
o
n
f
e
r
e
n
c
e
o
n
I
n
fo
r
m
a
t
i
o
n
o
r
g
/
a
c
is
2008
/
5
(
a
cc
e
s
o
oc
t
u
b
r
e
15
,
2012
)
.
con menor rentabilidad
s
obre lo
s
recur
s
o
s
propios, así como los de las emp
r
esas conMediante el empleo de la minería de
menor
s
olvencia.datos, en pa
r
ticula
r
de la herramienta
Gr
up
o 2:
P
re
s
enta un factor de rie
s
go mucho mayo
r
, meno
r
solvencia y meno
r
V
S
OMine, se cont
r
astó un caso distor-
rentabilidad
s
obre lo
s
recur
s
o
s
propio
s
que el Grupo 1.sionado típico del uso inadecuado de
Gr
up
o 3:
S
imilar al Grupo 1, a excepción de una solvencia mucho mayo
r
.los mapas autoo
r
ganizad
o
s que en cier-
La edad media de la compañía e
s
algo mayo
r
, aunque el
f
acto
r
de
r
iesgotas ocasiones se ha utilizado, en oposi-
parece
s
er similar al del Grupo 1. E
s
uno de los t
r
es g
r
upos más g
r
andes ención a un ejemplo bien concebido.
término
s
de número de cliente
s
.El análisis pe
r
mitió confirmar lo fruc-
Gr
up
o 4: Contiene la
s
empre
s
a
s
má
s
antiguas del conjunto de datos y, en
f
e
r
o que
r
esulta el uso adecuado de
general, pre
s
enta una elevada
s
olvencia y buena
r
entabilidad.los conceptos, las metodologías y el
Gr
up
o 5: E
s
un conjunto de tamaño me
d
io de mayo
r
alcance que las em
-
conocimiento ace
r
ca de los mapas au-
pre
s
a
s
promedio. La
s
olvencia e
s
buena y las emp
r
esas son
r
elativamentetoo
r
ganizados. De esta manera, se con-
nueva
s
. La rentabilidad e
s
media.t
r
ibuye a mejo
r
a
r
considerablemente su
Gr
up
o 6: E
s
un grupo de tamaño medio que incluye las emp
r
esas másaceptación y uso como herramienta de
rentable
s
del conjunto de dato
s
. Repre
s
enta las pequas emp
r
esas en c
r
eci
-
descub
r
imiento de in
f
o
r
mación y apo-
miento. Ca
s
i la mitad de la agrupación muest
r
a un
f
acto
r
de
r
iesgo muy alto,yo a la toma de decisiones en las em-
pero alguna
s
empre
s
a
s
s
on también muy
s
olventes.p
r
esas y los cent
r
os de in
v
estigación.
Gr
up
o
7
: El grupo e
s
de tamaño medio y aba
r
ca las emp
r
esas su
cien
-
temente grande
s
en rmino
s
de volumen
d
e negocio y activos totales. La
s
olvencia e
s
buena en promedio. El cúmulo comp
r
ende una mezcla de viejas
y nueva
s
empre
s
a
s
.
Gr
up
o 8: E
s
uno de lo
s
tre
s
grupo
s
de pequas emp
r
esas y contiene las
mayore
s
empre
s
a
s
en término
s
de activo
s
y volumen de negocios. Las em
-
pre
s
a
s
s
on
s
olvente
s
y rentable
s
de manera justa y su
f
acto
r
de
r
iesgo es muy
bajo. La antigüedad e
s
s
uperior a la media.
Gr
up
o 9: E
s
otro pequeño grupo de gra
n
des emp
r
esas. Di
e
r
e del G
r
upo
8 en que la
s
empre
s
a
s
s
on má
s
reciente
s
y la
r
otacn es meno
r
.
Gr
up
o 1
0
: E
s
el grupo má
s
pequeño y último identi
cado. Contiene com
-
pañía
s
en crecimiento que
s
on ba
s
tante rentables y solventes, y tiene un
f
ac
-
tor de rie
s
go muy bajo.
S
y
s
t
e
m
s
,
F
i
n
l
a
n
d
i
a
,
2008
.
h
tt
p
:
//
a
is
e
l
.
a
is
n
e
t
.
T
a
b
l
a
3
D
i
m
e
n
s
i
o
n
e
s
y
c
a
r
a
c
t
e
r
í
st
i
c
a
s
d
i
st
i
n
t
i
v
a
s
de
c
a
d
a
un
o
de
l
o
s
c
o
ng
l
o
m
e
r
a
d
o
s
(
F
u
e
n
t
e
:
[
3
]
)
.
Una vez identi
cado
s
lo
s
grupo
s
, el próximo paso
f
ue compa
r
a
r
la in
f
o
r
ma
-
ción de venta
s
para cada categoría de productos en los segmentos c
r
eados.
S
i la
cantidad de trabajo empleado en la
s
venta
s
pa
r
a cada uno de los segmentos es la
mi
s
ma, la divi
s
ión de lo
s
s
egmento
s
de clientes puede extende
r
se pa
r
a desc
r
ibi
r
a
lo
s
cliente
s
rentable
s
, a lo
s
promedio y a lo que sean sin
nes luc
r
ativos.
C
o
n
c
l
u
s
i
o
n
e
s
Lo
s
modelo
s
neuronale
s
ofrecen un nuevo en
f
oque de los datos y una nueva
forma de repre
s
entar la información multidimensional y compleja a
n de que el
s
er humano pueda entender la
s
relacione
s
s
ubyacentes, pe
r
mitiéndole descub
r
i
r
conocimiento no ob
s
ervable a
s
imple vi
s
ta.