G - Physics – 01 – C
Patent
G - Physics
01
C
G01C 11/36 (2006.01) G06T 7/00 (2006.01) G06T 7/20 (2006.01) H04N 7/26 (2006.01) H04N 13/00 (2006.01) H04N 17/00 (2006.01) G06T 15/00 (2006.01)
Patent
CA 2622327
There are two distinct tasks in vision or image processing. On the one hand there is the difficult task of image analysis and feature recognition, and on the other there is the less difficult task of computing the 3D world position of the camera given an input image. In biological vision, these two tasks are intertwined together such that it is difficult to distinguish one from the other. We perceive our position in world coordinates by recognizing and triangulating from features around us. It seems we can not triangulate if we don't identify first the features we triangulate from, and we can't really identify unless we can place a feature somewhere in the 3D world we live in. Most, if not all, vision systems in prior art are an attempt to implement both tasks in the same system. For instance, reference patent number US5,801,970 comprises both tasks; reference patent number US6,704,621 seems to comprise of triangulation alone, but it actually requires recognition of the road. If the triangulation task can indeed be made separate from and independent of the analysis and feature recognition tasks, then we would need half as much computing resources in a system that does not perform the latter task. By taking advantage of current advances in graphics processing, this invention allows for triangulation of the camera position without the usual scene analysis and feature recognition. It utilizes an a priori, accurate model of the world within the field of vision. The 3D model is rendered onto a graphics surface using the latest graphics processing units. Each frame coming from the camera is then searched for a best match in a number of candidate renderings on the graphics surface. The count of rendered images to compare to is made small by computing the change in camera position and angle of view from one frame to another, and then using the results of such computations to limit the next possible positions and angles of view to render the a priori world model. The main advantage of this invention over prior art is the mapping of the real world onto a world model. One application for which this is most suited is robotic programming. A robot that is guided by an a priori map and that knows its position in that map is far more superior to one that is not so guided. It is superior with regards to navigation, homing, path finding, obstacle avoidance, aiming for point of attention, and other robotic tasks.
L'invention concerne la visualisation ou le traitement d'images comprenant deux tâches distinctes, d'un côté la tâche difficile d'analyse des images et de reconnaissance des caractéristiques, et de l'autre la tâche moins difficile de calcul de la position 3D universelle de la caméra à partir d'une image. Dans la visualisation biologique, ces deux tâches sont intégrées d'une telle façon qu'il est difficile de les distinguer l'une de l'autre. Nous percevons notre position dans des coordonnées universelles par reconnaissance et triangulation à partir d'élémennts nous entourant. Nous ne pouvons apparemment pas procéder à cette triangulation si nous n'identifions pas d'abord les éléments à partir desquels s'effectue cette triangulation, et nous ne pouvons pas vraiment les identifier a moins de pouvoir placer un élément quelque part dans le monde 3D dans lequel nous vivons. La plupart, si non tous, des systèmes de visualisation de l'état de la technique tentent de mettre en oeuvre les deux tâches dans le même système. Par exemple, le numéro de demande de brevet de référence US6704621 comprend les deux tâches et le numéro de demande de brevet de référence US5801970 comprend seulement la triangulation, mais nécessite la reconnaissance de la route. Si la tâche de triangulation peut effectivement être séparée et indépendante des tâches d'analyse et de reconnaissance d'éléments, ceci signifie que la moitié des ressources de calcul est nécessaire dans un système n'exécutant pas ces dernières. En utilisant les avancements actuels en matière de traitement graphique, l'invention permet la triangulation de la position de la caméra sans l'analyse et la reconnaissance des éléments de la scène habituelles. Un modèle universel précis prédéterminé est utilisé dans le champ de vision. Le modèle 3D est obtenu sur une surface graphique à l'aide des dernières unités de traitement graphique. Chaque image de la caméra est alors recherchée pour une mise en correspondance optimale avec un certain nombre d'affichages candidats sur la surface graphique. Le nombre d'images affichées à comparer est réduit par calcul du changement de position de la caméra et de l'angle de vue d'une trame à une autre, puis par utilisation des résultats de ces calculs pour limiter les positions et angles de vue suivants possibles pour afficher le modèle universel prédéterminé. Le principal avantage de l'invention par rapport à l'état de la technique est la mise en correspondance du monde réel sur un modèle universel. L'invention est particulièrement adaptée pour la programmation robotique. Un robot guidé par une carte prédéterminée et connaissant sa position sur cette carte est largement supérieur à un autre non guidé, pour naviguer, rejoindre un point de ralliement, retrouver son chemin, éviter des obstacles, se diriger vers un point d'attention, et effectuer d'autres tâches robotiques.
Macpherson Leslie & Tyerman Llp
Tapang Carlos
LandOfFree
Frame by frame, pixel by pixel matching of model-generated... does not yet have a rating. At this time, there are no reviews or comments for this patent.
If you have personal experience with Frame by frame, pixel by pixel matching of model-generated..., we encourage you to share that experience with our LandOfFree.com community. Your opinion is very important and Frame by frame, pixel by pixel matching of model-generated... will most certainly appreciate the feedback.
Profile ID: LFCA-PAI-O-1641299