Escribir, y qué escribir.

2012-02-17 03:18

Por otro lado, escribí una serie muy popular de posts, llamada "PyQt en Ejemplos", que (adivinen) lleva mucho tiempo estancada.

El problema con el libro es que traté de cubrir demasiado terreno. Terminado sería un libro de 500 páginas, y eso incluye escribir media docena de apps de ejemplo, algunas de ellas en áreas en las que no soy experto.

El problema principal con los posts es que el ejemplo es pedorro (¡app de TODOs!) y expandirla es aburrido.

¡Qué mejor manera de resolver el problema que mezclar las dos cosas!

Voy a dejar Python No Muerde como está, y voy a hacer un libro nuevo, que se llame PyQt No Muerde. Va a mantener el tono y el lenguaje del anterior, y va a compartir varios capítulos, pero se va a enfocar en desarrollar apps PyQt, en vez de apuntar a metas demasiado ambiciosas. Espero que sea de unas 200 páginas.

Tengo permiso de la superioridad (mi señora) para trabajar en esto un par de horas al día temprano a la mañana. Tal vez avance, tal vez no. Como siempre, yo no prometo, experimento.

PyQt Quickie: Que no te lleve el basurero

2012-02-10 22:57

Qt tiene sus mecanismos para crear y eliminar objetos (el árbol de QObjects, smart pointers, etc.) y PyQt usa Python, así que tiene garbage collection.

Consideremos un ejemplo simple:

from PyQt4 import QtCore

def finished():
    print "El proceso termino!"
    # Salir de la aplicación
    QtCore.QCoreApplication.instance().quit()

def launch_process():
    # Hacer algo asincrono
    proc = QtCore.QProcess()
    proc.start("/bin/sleep 3")
    # Cuando termine, llamar a finished
    proc.finished.connect(finished)

def main():
    app = QtCore.QCoreApplication([])
    # Lanzar el proceso
    launch_process()
    app.exec_()

main()

Si ejecutás eso, te va a pasar esto:

QProcess: Destroyed while process is still running.
El proceso termino!

Encima el script no termina nunca. ¡Diversión! El problema es que proc está siendo borrado al final de launch_process porque no hay más referencias a él.

Ésta es una mejor manera de hacerlo:

from PyQt4 import QtCore

processes = set([])

def finished():
    print "El proceso termino!"
    # Salir de la aplicación
    QtCore.QCoreApplication.instance().quit()

def launch_process():
    # Hacer algo asincrono
    proc = QtCore.QProcess()
    processes.add(proc)
    proc.start("/bin/sleep 3")
    # Cuando termine, llamar a finished
    proc.finished.connect(finished)

def main():
    app = QtCore.QCoreApplication([])
    # Lanzar el proceso
    launch_process()
    app.exec_()

main()

Al agregar un processes global y meter ahí proc, mantenemos siempre una referencia, y el programa funciona. Sin embargo, sigue teniendo un problema: nunca eliminamos los objetos QProcess.

Si bien en este caso la pérdida de memoria es muy breve porque el programa termina enseguida, en un programa de verdad esto no es buena idea.

Así que necesitamos agregar una manera de sacar proc de processes cuando no lo necesitemo. Esto no es tan fácil como parece. Por ejemplo, esto no funciona bien:

def launch_process():
    # Hacer algo asincrono
    proc = QtCore.QProcess()
    processes.add(proc)
    proc.start("/bin/sleep 3")
    # Sacamos el proceso del global cuando no lo necesitamos
    proc.finished.connect(lambda: processes.remove(proc))
    # Cuando termine, llamar a finished
    proc.finished.connect(finished)

¡En esta versión, todavía tenemos un memory leak de proc, aunque processes esté vacío! Lo que pasa es que el lambda contiene una referencia a proc.

No tengo una my buena respuesta para este problema que no involucre convertir todo en miembros de un Qbject y usar sender para saber cuál proceso es el que termina, o usar QSignalMapper. Esa versión la dejo como ejercicio para el lector ;-)

Sacar la basura trae sus problemas

2012-01-31 18:08

Esto no debería sorprenderte:

>>> a = [1,2]
>>> b = [3,4]
>>> a is b
False
>>> a == b
False
>>> id(a) == id(b)
False

Después de todo, a y b son cosas distintas. Sin embargo:

>>> [1,2] is [3,4]
False
>>> [1,2] == [3,4]
False
>>> id([1,2]) == id([3,4])
True

Resulta que si uno usa literales, una de esas cosas no es como las demás.

Primero la explicación. Cuando uno no tiene más referencias a un dato, va a ser "garbage collected", la memoria se libera para que se pueda usar para otra cosa.

En el primer caso, las variables a y b guardan referencia a las listas. Es decir que tienen que existir todo el tiempo, ya que yo podría decir print a y python tiene que poder responderme con el valor de a.

En el segundo caso, uso literales, lo que quiere decir que no hay referencias a las listas después de que se usan. Cuando python evalúa id([1,2]) == id([3,4]) evalúa primero el lado izquierdo del ==. Después de que termina con eso, no hace falta mantener el [1,2] a mano, así que se borra. Entonces, al evaluar el lado derecho, crea [3,4].

Por pura casualidad, lo pone en exactamente el mismo lugar en que estaba el [1,2], asi que id devuelve el mismo valor. Esto sirve para recordar dos cosas:

a is b es usualmente (pero no siempre) equivalente a id(a) == id(b)
La recolección de basura tiene efectos secundarios que en una de esas no esperabas.

The problem is is. Is it not?

2012-01-28 18:14

Algunos, por alguna razón, hacen esto:

>>> a = 2
>>> b = 2
>>> a == b
True
>>> a is b
True

Y después, cuando ven esto, se sorprenden:

>>> a = 1000
>>> b = 1000
>>> a == b
True
>>> a is b
False

Se sorprenden porque "2 es 2" es más intuitivo que "1000 no es 1000". Podría atribuirlo a una tendencia innata al platonismo, pero en realidad es porque is no es eso.

El operador is es (en CPython) apenas una comparación de direcciones de memoria. Si los objetos a y b son el mismo cacho de memoria, entonces "son" el otro. Como python crea de antemano una cantidad de enteros pequeños, cada 2 que creás no es un nuevo 2, sino otra vez el 2 de la última vez.

Esto funciona por dos motivos:

Los enteros son solo lectura. Podés tener muchas variables que "contienen" el mismo 2, porque no lo pueden romper.
En python, la asignación es tan sólo crear aliases. No se hace una copia de 2 cuando se hace a = 2, solamente se dice "a es otro nombre para este 2 que tengo acá".

Esto sorprende a la gente que viene de otros lenguajes, por ejemplo C o C++. En esos lenguajes, una variable int a nunca usaría la misma memoria que int b porque justamente, una variable es un pedazo de memoria, y se puede cambiar el contenido. En C y C++, los enteros son mutables. Este 2 no es ese 2, a menos que lo hagas intencionalmente con punteros.

De hecho, la forma en que la asignación funciona en python lleva a otras sorpresas que son más interesantes en la vida real. Por ejemplo:

>>> def f(s=""):
...     s+='x'
...     return s
...
>>> f()
'x'
>>> f()
'x'
>>> f()
'x'

Eso no sorprende nada. Ahora, hagamos un pequeño cambio:

>>> def f(l=[]):
...     l.append('x')
...     return l
...
>>> f()
['x']
>>> f()
['x', 'x']
>>> f()
['x', 'x', 'x']

Y eso sí es sorprendente, si no lo esperabas. Sucede porque las listas son mutables. El argumento por default se define cuando la función se define, y cada vez que llamás f() estás usando y devolviendo la misma l. Antes, también usábamos siempre la misma s pero como los strings son inmutables, nunca cambiaba, y devolvíamos una nueva cada vez.

Podés comprobar que no te miento, obviamente que usando is. Y ya que estamos, eso no es un problema para listas. Es un problema para los objetos de cualquier clase que vos definas, a menos que los hagas inmutables. Así que seamos cuidadosos con los argumentos por defecto, ¿ok?

Volviendo al problema original de que 1000 is not 1000, lo sorprendente es que en realidad, no es interesante. Los enteros son fungibles. No te importa que sea el mismo entero, solo que sean iguales.

Comprobar identidad de enteros es como si me prestaras $1 y cuando te lo devuelvo, en vez de ver si es una moneda de $1, te fijaras si es la misma moneda. Simplemente no importa. Lo que queres es un 2, un 1000 o una moneda de $1.

Además, el reultado de 2 is 2 depende de la implementación de python. No hay motivo, en realidad, mas allá de una optimización, para que sea True.

Esperando que esto aclare el tema, les dejo un último fragmento de código:

.. code-block:: pycon

>>> a = float('NaN')
>>> a is a
True
>>> a == a
False

UPDATE: Muchos comentarios iteresantes en reddit y una continuación chiquita acá

Gente haciendo cosas útiles con mis juguetes

2012-01-25 10:33

¡Pero de golpe alguien fué y lo hizo hacer algo útil! Específicamente, para tener previews cuando edita documentos en sphinx

Está bueno :)

Ralsina.Me — El sitio web de Roberto Alsina

Publicaciones sobre python (publicaciones antiguas, página 71)

Escribir, y qué escribir.

PyQt Quickie: Que no te lleve el basurero

Sacar la basura trae sus problemas

The problem is is. Is it not?

Gente haciendo cosas útiles con mis juguetes