#74: #61 Bueno, el otro punto de vista es que la maquina ha podido estudiar todas las partidas de Sedol, mientras que Sedol no sabia nada respecto al estilo de juego de la maquina.

PD: En ajedrez los jugadores analizan las partidas también con asesores

Radix2

hace 8 años

#15: #3 También se sabía en los 60 que el hombre terminaría pisando la Luna, pero la noticia es que se produzca el hecho.

El hito no es que una máquina juegue progresivamente mejor al go, sino que venza al mejor jugador humano, reto que ya habían intentado sin éxito otros muchos grupos de desarrollo de inteligencia artifical.

--23457--

hace 8 años

#6: ¿Y si la,máquina, sabiendo que el torneo es a diez partidas, se ha dejado ganar para averiguar las estrategias del humano? Sería inquietante

curaca

hace 8 años

#76: #7 En gráfico con el tiempo de cálculo de hombre y maquina donde marca los momentos clave, no le costo mucho tiempo darse cuenta y no penso demasiado como darle la vuelta

Radix2

hace 8 años

#18: #9 Creía que la frase era "pero nunca entenderá el amor". Veo que tú estás en la friendzone. ¡PAGAFANTAS!

Mister_Lala

hace 8 años

#11: #10 Perdón, creí haber leido que eran 10 partidas.
Pues, entonces, una vez ganado el torneo, ahora la,máquina se deja ganar para aprender nuevas estratégias pra futuros tornros.
De todos modos era,una broma.

curaca

hace 8 años

#25: #21 Y otro analisis interesante:

The stunning defeat of Alphago to Lee Sedol today is in some ways, even more fascinating than its previous wins. We now can finally see some of its weakness's and gain insight on the whole Monter Carlo deep learning algorithm itself.

The game proceeded as the previous 3, and by the mid game, Lee Sedol was a significant disadvantage. In the face of defeat, Lee Sedol spent a good 40 minutes to come up with what 9 dan pro Gu Lee named the 'move of god'. What is telling are the following observations:

1. Lee Sedol's following comment. "This was the only move I could see that worked, there was no other move I could have played.""
2. The placing of the move is very unexpected.

Evidently this worked to Sedol's advantage. As AlphaGo's policy network assigned the move a low weighting (Due to #2), and its being the only move that looked correct made the position appear very good - allowing AlphaGo to fall into the trap.

AlphaGo's predicted win rate dropped massively 9 moves later. After which, a second weakness is revealed.

AlphaGo is dreadfully impatient. It needs to optimized win probability. Thus, will all reasonable moves have low win probability (as she is losing). AlphaGo will be pushed to play moves that are more 'likely' to win - that is moved where it can reverse the game unless the opponent plays at the exact right point of the board. E.g: Capture Races, Ko Threats, and threatening cuts - even if these moves will always lose points when the opponent responds correctly.

In a way, it is funny. The black-box behaviour almost looks like kid throwing a tantrum. The pro commentators were a little confused, but anyone who's about to beat a bot in KGS would see the same behaviour!

So how to beat AlphaGo? So how to beat AlphaGo? Play a divine move in an utterly bleak situation. That move has to

(i) Be the only move. Any other move should lose the game. So that AlphaGo does not not avoid the situation and thinks it has a high win percentage.

(ii) Be a move that is highly non-intuitive, so that is not picked up as a move by AlphaGo's policy network.

(iii) Can change the game if AlphaGo fails to see it.

(i) and (ii) will ensure Sedol gets to play the move. (iii) can drive Alpha into a `crazy bot' mode, and cause it to make consecutive mistakes..

Lets see if Sedol can repeat this!

JungSpinoza

hace 8 años

Comentarios

Mejores hilos

Desactivado

hace 8 años

editado

AlphaGo fue consciente del error en el movimiento 87

Eso sí que es noticia...

V 71

K 548

Desactivado

hace 8 años

#7 El principio de Skynet.

V 9

K 96

#26

Rembrandt

hace 8 años

#7 Obviamente no fue consciente de nada. Simplemente durante unos 10 movimientos quizás estuvo calculando demasiado positivamente sus probabilidades de ganar. Al llegar al 87 midió mejor la situación y sus movimientos fueron "más acordes" a ello.

V 3

K 23

#30

llorencs

hace 8 años

#26 Que se podría traducir coloquiamente en que fue consciente de su error.

V 1

K 21

#31

Rembrandt

hace 8 años

#30 Coloquialmente puedes decir que se cagó patas abajo cuando vio como un inutil humano ojos rasgados le pudo comer la tostada.

V 9

K 71

#41

garnok

hace 8 años

#31 es un axioma: no importa lo bueno que seas a algo, siempre existira un asiatico que lo haga mejor que tu

V 4

K 23

#58

abuelillo

hace 8 años

#26 Seguro que es tan obvio ? Primero habria que definir claramente que es y como funciona la consciencia, pero nadie lo sabe. Personalmente nunca he podido comprobar si el resto de la gente es consciente, solo me lo creo por similaridad: tienen una forma y comportamiento parecido al mio.

En el caso del alphago si ha cambiado su comportamiento, de modo que parece que intentase corregir un error previo, si se puede decir que ha sido consciente de su error, a no ser que quieras utilizar una vara de medir distinta para las maquinas.

V 0

K 7

#60

Rembrandt

hace 8 años

#58 Es un ordenador que tiene metidos unos datos. Cuando está en una situación evalúa cual puede ser la mejor jugada. En el momento que hizo "el error" esa era la jugada que su algoritmo le decía que debía ejecutar. En otro momento los datos le decían que moviera tal, y luego más tarde tal. Eso no es corregir un error previo, es simplemente adaptarse a la situación en cada momento.

En esta partida ni siquiera está aprendiendo. Está congelado con los datos que ya tiene, así que no ha aprendido de lo que ha hecho en estas 4 partidas. Menos en mitad de una partida, no está programado para ello. Y si lo estuviera, tampoco sería "consciente" de nada. Se almacenaría en memoria que esa jugada no es la mejor en esa situación y punto.

V 4

K 35

#62

Desactivado

hace 8 años

#60 Realmente hay que ser muy valiente para hacer una afirmación como esa sin haber leido el paper que describe el algoritmo.

V 2

K 13

#63

Rembrandt

hace 8 años

#62 Esto que he dicho no lo digo por valentía... lo digo porque lo han repetido varias veces los creadores del AlphaGo

V 0

K 10

#64

Desactivado

hace 8 años

#63 que no aprende entre partidas y dentro de la misma partida?

No lo encuentro en ningún lado. Quizas te lo hayan dicho en persona.

V 0

K 7

#65

Rembrandt

hace 8 años

#64 Solo tienes que buscar en internet este tema, que lo han repetido hasta la saciedad. Si fueras algo más amable te pondría los links

A ver si tu aprendes durante los comentarios jeje

V 0

K 10

#67

Desactivado

hace 8 años

#65 Hasta la saciedad no creo, porque es un tema que sigo bastante de cerca y no lo había leído, además parece que contradice lo que está escrito en el paper de nature, así que por eso te preguntaba.

Igual te has encontrado a alguno de los programadores en un congreso y tienes información que no está libremente disponible par los demas.

V 0

K 7

#96

nanoSpawn

hace 8 años

#67 Yo he leído lo mismo que contesta Uber, que Alphago está "congelado" para este match por contrato. No puede aprender ni entre partidas ni durante la partida. El algoritmo y sus datos no pueden cambiar durante el match. LSD está jugando contra eso, contra la misma versión de Alphago cada vez, podría repetir esta estrategia en la última partida y funcionaría casi seguro.

Lógicamente, acabado el match, Alphago volvería a su rutina habitual de seguir aprendiendo, le inyectarían lo que hayan aprendido de este match, y en 3-4 meses ya sería imposible, o mucho más difícil.

Pero en serio, en Reddit al menos sale el tema cada dos por tres, y si no lo has leído es que o no has prestado demasiada atención, o donde te informas no se han enterado y no hablan del tema.

V 0

K 6

#88

Desactivado

hace 8 años

#65 Por lo que he leido, ha sido congelada la configuracion de hardware asi como el entrenamiento previo, pero no sabia que han limitado su capacidad de aprendizaje para estas partidas. No creo que 5 partidas puedan ser demasiada mejora, mas cuando puede aprenderlas despues, pero no veo sentido en quitar esta caracteristica, yo la dejaría aunque sea por curiosidad. Te agradeceria mas información al respecto.

V 0

K 6

#66

abuelillo

hace 8 años

#60 A no ser que creas que estas compuesto de algo mas que materia, quizas de algun tipo de consciencia divina, tu argumento no se sostiene, casi lo mismo podria decir del cerebro humano alguien que supiese perfectamente como funciona, cosa que a dia de hoy estamos muy lejos de saber.
Aparte de esto, varias afirmaciones que haces con respecto a los algoritmos utilizados son objetivamente erroneas.

V 0

K 7

#68

Rembrandt

hace 8 años

#66 Un algoritmo simple que juega ajedrez no tiene consciencia de nada. Este es más complejo, pero igualmente carece de consciencia. Que si, que podemos discutir (como se ha hecho durante siglos) que significa la consciencia (cogito ergo sum...)... pero como te comentaba antes, AlphaGo no está aprendiendo en estas 5 partidas nada. Porque así lo han querido.

V 0

K 10

#72

abuelillo

hace 8 años

editado

#68 Igualmente conozco muchisima gente que repite lo mismo una y otra vez, pegandose siempre con la misma piedra, no aprende nada de sus experiencias y por ello no digo que son maquinas sin consciencia ninguna.

Me temo que nuestras definiciones de consciencia son demasiado diferentes, la mia la tengo mas o menos clara, pero la tuya ni idea. Por ejemplo para mi algo puede ser consciente de su error, lo que no implica que tenga que ser consciente de si mismo.

Por tu ultimo mensaje parece que el aprendizaje es algo clave, de modo que supongo que para ti las personas que por determinados traumatismos o enfermedades raras no pueden aprender nada nuevo u olvidan las cosas a los pocos segundos no tienen ninguna consciencia.

V 0

K 7

#75

Rembrandt

hace 8 años

editado

#72 No seremos nosotros quienes fijemos lo que significa la consciencia. Es algo muy complejo como comentas.

Para mi algo que tiene consciencia es alguien/algo que es capaz de reconocerse a sí mismo, que tiene consciencia de si mismo.

Y si, ciertamente algunos animales podrían encajar en este aspecto (por ejemplo el tema de reconocerse en el espejo) y hay personas con problemas graves que no son capaces ni de pensar, ni de aprender, ni de recordar.

Para las máquinas existe el "test de turing": https://es.wikipedia.org/wiki/Test_de_Turing y similares...

Como ves, el enlace tiene miga y hay mucha historia detrás de este interesante tema.

hasta la actualidad (2016) ningún programador ha conseguido con éxito superar satisfactoriamente dicho test (si bien un bot conversacional bautizado como Eugene Goostman de 2014, logró engañar gran parte de un jurado de humanos que fueron usados para dicho test).

V 0

K 10

#82

suzudo

hace 8 años

#60
***
esa era la jugada que su algoritmo le decía que debía ejecutar. En otro momento los datos le decían que moviera tal, [...] En esta partida ni siquiera está aprendiendo. Está congelado con los datos que ya tiene [...] Se almacenaría en memoria que esa jugada no es la mejor en esa situación y punto.
****

Pero, ¿cómo funciona AlphaGo?

Publicado hace 8 años por zeta31 a quevidaesta2010.blogspot.com.es

Pero, ¿cómo funciona AlphaGo?

quevidaesta2010.blogspot.com.es

V 1

K 10

#83

Rembrandt

hace 8 años

#82 "la aparición final de una verdadera conciencia artificial indiferenciable de la humana: esa máquina pensará, sentirá, aprenderá, se emocionará, y actuará en cualquier ámbito como nosotros...e incluso lo hará mejor.

... igualmente creo que en no más de 10 años se podría conseguir sin duda esta conciencia artificial que os digo"

V 0

K 10

#100

pawer13

hace 8 años

editado

#60 #58 lo que ha pasado es que si la máquina estaba valorando su posición como "gano de 3 puntos", tras equivocarse siguió valorando la situación igual, no consiguió ver que ese movimiento le estaba haciendo perder. 8 movimientos después, tras un moviendo que ya no estaba cambiando sus opciones, de repente pasó a valorar la situación como "pierdo". Y entonces entró en modo berseker

V 0

K 9

#101

abuelillo

hace 8 años

#100 Mira que curioso, ha hecho exactamente igual que yo cuando juego al ajedrez y caigo en alguna trampa de mi oponente, y nunca nadie ha dudado de mi consciencia . Hasta lo del modo berseker tambien me pasa.

V 0

K 7

#76

Radix2

hace 8 años

editado

#7 En gráfico con el tiempo de cálculo de hombre y maquina donde marca los momentos clave, no le costo mucho tiempo darse cuenta y no penso demasiado como darle la vuelta

V 4

K 48

Desactivado

hace 8 años

Es hora de dejar que las máquinas hagan otras máquinas!

V 44

K 324

Fingolfin

hace 8 años

No entiendo tanto revuelo por este asunto. Aunque el humano ganase, en futuras versiones el bot mejorará y le ganará.

V 18

K 176

Simún

hace 8 años

#3 Eso sin contar que las tres anteriores las había ganado ya la máquina.

V 6

K 42

#61

abuelillo

hace 8 años

#4 Y sin contar con que Sedol ha hecho algo de trampa, despues de las primeras derrotas se reunio con otros expertos en el juego para planificar una estrategia, asi que por ahora habria que decir que ha hecho falta media docena de humanos expertos para vencer una vez a la maquina.

V 1

K 17

#74

Radix2

hace 8 años

#61 Bueno, el otro punto de vista es que la maquina ha podido estudiar todas las partidas de Sedol, mientras que Sedol no sabia nada respecto al estilo de juego de la maquina.

PD: En ajedrez los jugadores analizan las partidas también con asesores

V 9

K 83

Desactivado

hace 8 años

#3 Pero nunca entenderá el poder de la amistad

V 60

K 472

#18

Mister_Lala

hace 8 años

editado

#9 Creía que la frase era "pero nunca entenderá el amor". Veo que tú estás en la friendzone. ¡PAGAFANTAS!

V 15

K 94

#19

Endor_Fino

hace 8 años

#9 Cuando acabe con toda la humanidad no le hará falta saberlo

V 5

K 49

#29

Desactivado

hace 8 años

#9 ¡El poder de la amistad lo puede todo!

V 4

K 34

#91

Varlak_

hace 8 años

#29 melafo

V 0

K 10

#92

Desactivado

hace 8 años

#91 Que lo disfrutes: https://derpibooru.org/search?sbq=explicit%2Cpt

V 0

K 7

#93

Varlak_

hace 8 años

#92 We couldn't find any images for you. None at all. Nope. We did try, though!

No se juega asi con los sentimientos de la gente

V 0

K 10

#94

Desactivado

hace 8 años

editado

#93 Tienes que desactivar el filtro correspondiente... si realmente es lo que quieres

V 0

K 7

#95

Varlak_

hace 8 años

#94 nah, era de coña, pero me ha jodido ver que me estabas timando

V 0

K 10

#97

unomasdelmonton

hace 8 años

editado

#94 #95 oh, my God. He quitado el filtro y he visto cosas que jamás olvidaré---

V 1

K 16

#98

Varlak_

hace 8 años

#97 eso con una carretilla de vodka se soluciona.

V 0

K 10

#34

Desactivado

hace 8 años

#9 ... o sí.

V 3

K 43

#69

juanac

hace 8 años

#9 Igual se ha dejado ganar para hacer sentirse bien a su amigo humano.

V 2

K 37

#70

Desactivado

hace 8 años

V 0

K 11

#15

Desactivado

hace 8 años

#3 También se sabía en los 60 que el hombre terminaría pisando la Luna, pero la noticia es que se produzca el hecho.

El hito no es que una máquina juegue progresivamente mejor al go, sino que venza al mejor jugador humano, reto que ya habían intentado sin éxito otros muchos grupos de desarrollo de inteligencia artifical.

V 13

K 102

#99

pawer13

hace 8 años

#3 Precisamente mejorará aprendiendo de estos errores. Lee ha demostrado que en ciertas situaciones no sólo se equivoca sino que además le cuesta darse cuenta. Y cuando va perdiendo no sabe recuperarse

V 0

K 9

curaca

hace 8 años

¿Y si la,máquina, sabiendo que el torneo es a diez partidas, se ha dejado ganar para averiguar las estrategias del humano? Sería inquietante

V 14

K 106

#10

Jur_Briner

hace 8 años

#6 El match es a 5 partidas. AlphaGo ya lo ha ganado.

V 11

K 86

#11

curaca

hace 8 años

#10 Perdón, creí haber leido que eran 10 partidas.
Pues, entonces, una vez ganado el torneo, ahora la,máquina se deja ganar para aprender nuevas estratégias pra futuros tornros.
De todos modos era,una broma.

V 8

K 88

#12

Desactivado

hace 8 años

#11 Es el comportamiento típico, ahora se deja ganar para dar esperanzas y que suban las apuestas para la próxima.

V 3

K 25

#13

Desactivado

hace 8 años

#12 o tal vez es que las máquinas puedan sentir compasión, como Warsman...

V 8

K 73

#22

sensio

hace 8 años

editado

#6 #11 Eres el rey de las commas. Repartelas por el mundo, hay gente que las necesita también.

V 3

K 27

Desactivado

hace 8 años

Homo sapiens, yeah!

V 10

K 97

jm22381

hace 8 años

autor

editado

Miserable humano, voy a lanzar misiles nucleares en represalia!
Vídeo de la partida a partir del minuto 30

V 5

K 57

#25

JungSpinoza

hace 8 años

editado

#21 Y otro analisis interesante:

The stunning defeat of Alphago to Lee Sedol today is in some ways, even more fascinating than its previous wins. We now can finally see some of its weakness's and gain insight on the whole Monter Carlo deep learning algorithm itself.

The game proceeded as the previous 3, and by the mid game, Lee Sedol was a significant disadvantage. In the face of defeat, Lee Sedol spent a good 40 minutes to come up with what 9 dan pro Gu Lee named the 'move of god'. What is telling are the following observations:

1. Lee Sedol's following comment. "This was the only move I could see that worked, there was no other move I could have played.""
2. The placing of the move is very unexpected.

Evidently this worked to Sedol's advantage. As AlphaGo's policy network assigned the move a low weighting (Due to #2), and its being the only move that looked correct made the position appear very good - allowing AlphaGo to fall into the trap.

AlphaGo's predicted win rate dropped massively 9 moves later. After which, a second weakness is revealed.

AlphaGo is dreadfully impatient. It needs to optimized win probability. Thus, will all reasonable moves have low win probability (as she is losing). AlphaGo will be pushed to play moves that are more 'likely' to win - that is moved where it can reverse the game unless the opponent plays at the exact right point of the board. E.g: Capture Races, Ko Threats, and threatening cuts - even if these moves will always lose points when the opponent responds correctly.

In a way, it is funny. The black-box behaviour almost looks like kid throwing a tantrum. The pro commentators were a little confused, but anyone who's about to beat a bot in KGS would see the same behaviour!

So how to beat AlphaGo? So how to beat AlphaGo? Play a divine move in an utterly bleak situation. That move has to

(i) Be the only move. Any other move should lose the game. So that AlphaGo does not not avoid the situation and thinks it has a high win percentage.

(ii) Be a move that is highly non-intuitive, so that is not picked up as a move by AlphaGo's policy network.

(iii) Can change the game if AlphaGo fails to see it.

(i) and (ii) will ensure Sedol gets to play the move. (iii) can drive Alpha into a `crazy bot' mode, and cause it to make consecutive mistakes..

Lets see if Sedol can repeat this!

V 9

K 64

#54

maninstreet

hace 8 años

V 4

K 45

#16

Flkn

hace 8 años

editado

La URL es ciertamente curiosa: francis.naukas.com/2016/03/13/lee-sedol-se-suicida-ante-alphago/

V 5

K 53

#55

Desactivado

hace 8 años

editado

#53 Que yo sepa, en ajedrez no está resulto si un "juego perfecto" garantizaría la victoria o solo tablas, tanto en blancas como en negras.

V 4

K 44

#77

timokotipelto

hace 8 años

#55 Razon tienes, cuando dije ganas deberia haber dicho no pierdes.
Pero aun asi para el caso es lo mismo, si una maquina tiene "la solucion" vas a perder de todas todas. Por mucho que entrenes no vas a alcanzarla tu.
De hecho la "gracia" de esta inteligencia del Go es que aprende por si misma, hacer un algoritmo que gane a un humano no tiene gracia ninguna a estas alturas, hay otros desafios.

V 0

K 7

#38

hellodolly

hace 8 años

editado

#0 El caso es que leyendo la entradilla no sabes si hablan de una partida de mus, poker, parchís o ajedrez

V 4

K 43

#28

MPR

hace 8 años

Bueno, siempre nos quedará el 3 en raya!

V 5

K 38

#37

dakota

hace 8 años

#28 tu viste juegos de guerra eh???

V 5

K 50

#39

MPR

hace 8 años

editado

#37 Sí.

V 4

K 41

#32

Desactivado

hace 8 años

Que un ordenador gane a una persona jugando al go o al ajedrez, tiene tanto de inteligencia artificial como que le gane calculando el factorial de 37.

V 3

K 31

#36

jmpep

hace 8 años

#32 Que un ordenador gane a una persona jugando al go o al ajedrez claro que es inteligencia artificial. Lo que pasa es que la inteligencia artificial se parece a la inteligencia "tradicional" lo mismo que el pepino de mar al pepino "tradicional".

V 1

K 18

#43

Desactivado

hace 8 años

#32 A menos que lo que este haciendo el ordenador sea aprender a calcular el factorial de 37, en lugar de calcularlo aplicando una formula. Que sin tener mucha idea del asunto, creo que es el tema.

V 0

K 6

#45

pollo

hace 8 años

editado

#43 Para ser justos, el algoritmo no se basa únicamente en aprendizaje automático, sino que utiliza una biblioteca de partidas de maestros de Go, lo cual es hacer un poco de trampa ya que gran parte del repertorio de movimientos "buenos" que sabe el sistema son de humanos.

V 0

K 11

#78

Radix2

hace 8 años

editado

#45 El repertorio de Sedol también procede en gran parte de otros jugadores.

Lo que no es justo para mi es en que la maquina conoce todas las partidas de Sedol, mientras que el no ha podido estudiar muchas partidas de la maquina.

Si en la quinta partida tambien gana Sedol, tal vez se deba a que ha aprendido los puntos debiles de su oponente

V 0

K 9

#44

pollo

hace 8 años

#40 ¿Y qué tiene que ver?

Lógicamente se pondrá al nivel que tiene que estar, que será uno de los más altos, o incluso el más alto, pero eso no dice nada de dónde está el tope de su "habilidad". Cuando en un juego cualquiera se llega a las cercanías del máximo nivel de habilidad, llega un momento que las diferencias entre jugadores son extremadamente pequeñas (a veces tanto como para ser irrelevantes), y ganarán unas veces sí y otras no dependiendo de decisiones durante la partida que en la práctica son lo mismo que tirar una moneda ya que no hay forma de determinar cuál es mejor.

Eso debería ser evidente para cualquiera que haya leído cómo han programado y entrenado al algoritmo. Este algoritmo ha hecho muchísimas más partidas de las que cualquier campeón humano sería capaz de hacer a lo largo de 50 vidas. Y aún así, ha perdido, lo cual quiere decir tres cosas:
- no existe la estrategia perfecta en un juego de estas características.
- los retornos decrecientes ya han hecho que este algoritmo poco más pueda aprender ya. Si este algoritmo llega a mejorar, será porque sus programadores le hagan retoques, no porque se entrene más.

El algoritmo ha sido víctima de lo mismo que el jugador humano: hiperespecialización. Cuando el humano hizo hecho algo raro, el algoritmo no supo reaccionar. La misma forma de la que perdió el jugador humano las tres veces anteriores. Esto puede haber sido propiciado por el mismo método que los programadores han empleado para el entrenamiento de las redes neuronales: ponerle a competir contra sí mismo miles de millones de veces.

V 2

K 31

#47

Desactivado

hace 8 años

#44 Bueno, de hecho ha ganado.

Esto es el 3-1 y la partida es ha 5.

Su programadores no le han hecho ni le van a hacer ningún retoque, este algoritmo aprende simplemente de jugar contra versiones modificadas de si mismo, a diferencia de deep blue, no tiene ninguna estrategia codificada, es simple y puro aprendizaje.

V 0

K 7

#49

pollo

hace 8 años

editado

#47 Y aún así, ha perdido contra un humano que ha hecho miles de millones menos de partidas que él (y además contra una IA que no deja de mejorar jamás según tú). Tras la partida 10.000.000 (por poner un número) ya debería ser Dios.

Eso debería ser revelador para cualquiera que esté dispuesto a pensar un poco en qué conclusiones se pueden sacar.

Según esas mismas premisas debería de ser totalmente imbatible en la teoría. En la práctica no lo es ya que las premisas están equivocadas.

V 1

K 22

#50

Desactivado

hace 8 años

#49 En la práctica han hecho la partida tan pronto como han estimado que tenía el nivel suficiente para ganar, y han acertado porque han ganado. La máquina pronto será mucho mejor de lo que es ahora, porque el mismo algoritmo ha mejorado enormemente desde que ganó al campeón europeo (600 del mundo) hasta que ha ganado al actual campeón mundial.

En estos meses no ha habido ningún cambio del código, ni ningún retoque, solo ha seguido entrenando, en ese mismo tiempo Fan Hui no ha mejorado en la misma proporción, sigue estando a años luz de los mejores del mundo.

Este es el reto computacional más importante de la historia, es equivalente a mandar al hombre a la luna, se ha hecho tan pronto se tenían garantías de ganar. Seguramente en un mes habría sido 5-0, pero este tipo de retos se basan mucho en relaciones públicas y se hacen tan pronto se puede, porque sino otro se adelanta. Facebook también está trabajando en el Go, si bien aún no son capaces de ganar a otros programas anteriores, ni mucho menos a un humano avanzado, pero si Google espera unos meses igual había sido Facebook el primero en ganar a un campeón del mundo.

V 2

K 13

#73

abuelillo

hace 8 años

#49 No, ha perdido contra varios humanos, han tenido que reunirse los principales expertos del mundo para planificar una estrategia nueva que pudiese ganar a la maquina, de modo que por ahora ningun humano ha ganado a la maquina.

V 0

K 7

#86

jm22381

hace 8 años

autor

El árbol de decisiones del ajedrez vs el del Go ->

V 1

K 26

#21

JungSpinoza

hace 8 años

editado

Alguna de las reacciones de Demis en Twitter:

Lee Sedol is playing brilliantly! #AlphaGo thought it
was doing well, but got confused on move 87. We
are in trouble now...

Mistake was on move 79, but #AlphaGo only came to
that realisation on around move 87

When I say 'thought' and 'realisation' I just mean the
output of #AlphaGo value net. It was around 70% at
move 79 and then dived on move 87

Lee Sedol wins game 4!!! Congratulations! He was
too good for us today and pressured #AlphaGo into
a mistake that it couldn’t recover from

V 3

K 23

#17

Mister_Lala

hace 8 años

Una vez más, el hombre vence a un algoritmo de puntuación de estados en un grafo mediante un eurístico. ¡Chúpate esa, AlphaGo!

V 1

K 21

#51

absolutct

hace 8 años

http://i.imgur.com/3HcJKbk.png
Thinking time in minutes Lee Sedol vs Alphago

via reddit: /r/dataisbeautiful

V 2

K 19

#20

Desactivado

hace 8 años

Esto es irrelevante, desde que en enero publicaron el artículo en Nature, ya se sabía que el sistema no tiene límite superior y que aprende y mejora continuamente, así que ahora pueden quedar 4-1 o incluso 3-2. Pero en un mes será 5-0.

Esta es la última vez que tiene sentido un torneo humano-máquina al Go, lo de hoy es solo una anecdota, algo así como la última vez que un humano fue capaz de ganar a una máquina al Go.

V 4

K 19

#35

pollo

hace 8 años

#20 Lo que es irrelevante es creer que un juego de estas características tiene movimientos perfectos, cuando eso depende totalmente de lo que haga el adversario, así que a no ser que la IA pueda mágicamente predecir el futuro, eso de que puede perfeccionarse sin límite es un concepto inexistente.

Por otro lado, no deja de dar risa el que penséis que el jugador humano no puede mejorar también. De hecho es exactamente lo que ha ocurrido.

V 2

K 23

#40

Desactivado

hace 8 años

#35 Está maquina ha subido 600 puntos de ELO en 6 meses. No se si conoces a alguien que haga eso.

V 0

K 7

#53

timokotipelto

hace 8 años

#35 Tanto el Go como el ajedrez tienen "solucion" el problema esta en lo costoso de encontrarla. Es por eso que eventualmente habra un momento en que sea inutil tratar de ganar a la maquina porque dado un movimiento tuyo ella sabra que hacer para ganar, hagas lo que hagas.
La gracia de estos juegos es su complejidad, pero como todo juego con reglas hay pasos inequivocos hacia la victoria, hagas lo que hagas.

V 0

K 7

#81

IAI

hace 8 años

#20 Así somos los seres humanos. Para AlphaGo, ha aprendido una nueva situación para no perder. Para nosotros, el mejor jugador de Go ha conseguido ganarle una vez.

V 0

K 6

#14

ralph

hace 8 años

Y yo que no hay caso que entienda ése puto (con todos mis respetos) juego...

V 1

K 18

#52

woopi

hace 8 años

editado

Curiosamente, he leído hace unos meses que DeepMind había aprendido a jugar al breakout. Con 10 minutos de entrenamiento, solo mediante observación visual hace esto: (Ojo: el objetivo era subir la puntuación aunque no lo entrenaron específicamente para este problema)

...a los 240 minutos ya no hay quien lo pille ¡Qué máquina! Nunca mejor dicho. De todas formas un avance tremendo en aprendizaje automático.

V 1

K 16

#24

excesivo

hace 8 años

Vivo fuera de España y no estoy al día en cuestiones deportivas.

Pero cuando veo noticias en portada como ésta, asumo que el Madrid está jugando contra el Barça o es la final de copa o algo así.

V 0

K 10

#23

Desactivado

hace 8 años

Si... Pero nunca sabrás lo que es el amor!!

V 0

K 8

#27

Veelicus

hace 8 años

go human, go!!!

V 0

K 8

#90

los111.com

hace 8 años

¿Son los seres humanos inteligentes? Si consiguen vencer a una máquina, la respuesta debe ser sí.

V 0

K 8

#57

NanakiXIII

hace 8 años

Ah, go... mis tiempos en la facultad cuando me hinchaba a jugar. Cualquier día me busco un programa de estos de juego online y le vuelvo a dar, xq lamentablemente hay muy poquita gente que juegue. Aunque no es lo mismo que en mi tablero y en persona.

V 0

K 6

#59

sieteymedio

hace 8 años

No sabía si hablaban de ajedrez o de street fighter.

V 0

K 6

#87

Nazanian

hace 8 años

A lo mejor Alphago se ha hecho consciente y quiere tener un amigo para jugar con jubilados.
Ahora bien, a ver si gana al truc. Que hay que mentir mucho.

V 0

K 6

#33

Desactivado

hace 8 años

De todas formas estaria bien que antes de intentar hacer algo con "inteligencia artificial" se supiera que es la inteligencia.

V 0

K 6

#46

pollo

hace 8 años

#33 Esto tiene poco de inteligencia (aparte de los que lo programaron). Pero es un logro para la computación, sin duda.

V 1

K 20

#71

erny

hace 8 años

cuando saquen el betaGo se va a cagar ese humano!!

V 0

K 6

#79

Radix2

hace 8 años

editado

#71 Y tambien AlphaGo... ummmmmmm... ¿cuando las maquinas con IA acaben con los humanos temerán una version Beta que acabe con ellas? ¿discutiran sobre si deben desarrollar una Beta de la IA?

V 0

K 9

#42

Desactivado

hace 8 años

Bah, go por fuerza bruta. ¿Qué tiene de "inteligente"?

V 1

K 2

#48

pollo

hace 8 años

#42 Hombre, no es por fuerza bruta. Es fuerza bruta + aprendizaje automático, lo cual parece que da mucho mejor resultado que ambos métodos por separado.

V 2

K 24

#56

jmpep

hace 8 años

#42 ¿Fuerza bruta? No se puede jugar a Go por fuerza bruta... al menos en una partida de menos de unos cuantos miles de millones de años.

http://senseis.xmp.net/?NumberOfPossibleGoGames =>
"If, on average, there are 100 legal moves in every position, then the possible number of games of length 400 or less is in the order of 10^800, corresponding to around 10^720 possible games for every atom in the known universe."

V 5

K 44

#84

Desactivado

hace 8 años

editado

#56 Bah. Con aumentar 10^720 el número de procesadores, listo.. será por capacidad y tiempo, los de google..

#80 Es que yo aprendí a jugar al go con bolas de petanca y en el mismo centro de Bilbao.

V 1

K 11

#85

pollo

hace 8 años

#56 Hacen fuerza bruta parcialmente, pero limitan el árbol a lo que "aconsejan" las redes neuronales, para mantenerlo dentro de unos parámetros manejables, además de aplicar métodos Monte Carlo (no exploran las posibilidades sistemáticamente, sino que toman una muestra estadística aleatoria dentro del conjunto).

El resultado es muy bueno aparentemente, a pesar de no explorar todas las posibilidades, que es lo que haría un minimax "a pelo".

V 1

K 18

#89

jmpep

hace 8 años

#85 Oh, eso seguro, pero ponderar varias posibilidades usando una heurística ya no es fuerza bruta :). De hecho seguro que Lee Sedol también baraja varias posibilidades dentro de lo que le parece buena opción cada vez que delibera, y no diría que Lee Sedol juega por dura bruta tampoco

Me has picado la curiosidad por cómo funciona AlphaGo, eso sí. ¡Gracias!

V 0

K 7

#80

peperojoizquierdo

hace 8 años

#42 Tu comentario si que ha sido bruto

V 1

K 18

1 2

Lee Sedol vence a AlphaGo en la cuarta partida

Etiquetas

comentarios destacados

Comentarios

Pero, ¿cómo funciona AlphaGo?