2018 ieee winter conference on applications of computer ... · 2018 ieee winter conference on...

2018 IEEE Winter Conferenceon Applications of Computer

Vision

WACV 2018

Table of Contents

Message from the General and Program Chairs xxviOrganizing Committee and Area Chairs xxvii

Oral 1A: Faces / Biometrics

Multilinear Autoencoder for 3D Face Model Learning 1 Victoria Fernández Abrevaya (Inria), Stefanie Wuhrer (Inria), and Edmond Boyer (Inria)

Emotion Analysis Using Audio/Video, EMG and EEG: A Dataset and Comparison Study 10 Farnaz Abtahi (CUNY Graduate Center), Tony Ro (CUNY Graduate Center), Wei Li (City College of New York), and Zhigang Zhu (CUNY Graduate Center)

To Frontalize or Not to Frontalize: Do We Really Need Elaborate Pre-processing to Improve FaceRecognition? 20 Sandipan Banerjee (University of Notre Dame), Joel Brogan (University of Notre Dame), Janez Križaj (University of Ljubljana), Aparna Bharati (University of Notre Dame), Brandon Richard Webster (University of Notre Dame), Vitomir Štruc (University of Ljubljana), Patrick J. Flynn (University of Notre Dame), and Walter J. Scheirer (University of Notre Dame)

Thermal to Visible Synthesis of Face Images Using Multiple Regions 30 Benjamin S. Riggan (U.S. Army Research Laboratory), Nathaniel J. Short (U.S. Army Research Laboratory), and Shuowen Hu (U.S. Army Research Laboratory)

Face and Body Association for Video-Based Face Recognition 39 KangGeon Kim (Institute for Robotics and Intelligent Systems), Zhenheng Yang (Institute for Robotics and Intelligent Systems), Iacopo Masi (Institute for Robotics and Intelligent Systems), Ramakant Nevatia (Institute for Robotics and Intelligent Systems), and Gérard Medioni (Institute for Robotics and Intelligent Systems)

Face Liveness Detection Based on Perceptual Image Quality Assessment Features with Multi-scaleAnalysis 49 Chun-Hsiao Yeh (National Taiwan University) and Herng-Hua Chang (National Taiwan University)

v

Multiple Anthropological Fisher Kernel Framework and Its Application to Kinship Verification 57 Ajit Puthenputhussery (New Jersey Institute of Technology), Qingfeng Liu (New Jersey Institute of Technology), and Chengjun Liu (New Jersey Institute of Technology)

Micro-Expression Spotting Using the Riesz Pyramid 66 Carlos Arango Duque (Univ Lyon), Olivier Alata ( UJM-Saint-Etienne), Remi Emonet ( UJM-Saint-Etienne), Anne-Claire Legrand ( UJM-Saint-Etienne), and Hubert Konik ( UJM-Saint-Etienne)

3D Head Pose Estimation Enhanced Through SURF-Based Key-Frames 75 Francisco Madrigal (CNRS), Frederic Lerasle (Univ de Toulouse), and Andre Monin (CNRS)

Predicting Facial Attributes in Video Using Temporal Coherence and Motion-Attention 84 Emily M. Hand (University of Maryland), Carlos D. Castillo (University of Maryland), and Rama Chellappa (University of Maryland)

Fusion of Infrared and Visible-Light Videos Using Motion-Compensated Temporal Sub-BandDecompositions 93 Jonathan N. Gois (Centro Federal de Educação Technógica Celso Suckow da Fonseca), Eduardo A. B. da Silva (Universidade Federal do Rio de Janeiro), Carla L. Pagliari (Instituto Militar de Engenharia), and Marcelo M. Perez (Instituto Militar de Engenharia)

Identity-Preserving Face Recovery from Portraits 102 Fatemeh Shiri (Australian National University), Fatih Porikli (Australian National University), Richard Hartley (Australian National University), and Piotr Koniusz (Data61/CSIRO)

Weakly Supervised Facial Attribute Manipulation via Deep Adversarial Network 112 Yilin Wang (Arizona State University), Suhang Wang (Arizona State University), Guojun Qi (University of Central Florida), Jiliang Tang (Michigan State University), and Baoxin Li (Arizona State University)

Face-MagNet: Magnifying Feature Maps to Detect Small Faces 122 Pouya Samangouei (University of Maryland Institute for Advanced Computer Studies), Rama Chellappa (University of Maryland Institute for Advanced Computer Studies), Mahyar Najibi (University of Maryland Institute for Advanced Computer Studies), and Larry S. Davis (University of Maryland Institute for Advanced Computer Studies)

ECLIPSE: Ensembles of Centroids Leveraging Iteratively Processed Spatial Eclipse Clustering 131 Chunchun Li (Vision and Security Technology (VAST) Lab University of Colorado Colorado Springs), Manuel Günther (Vision and Security Technology (VAST) Lab University of Colorado Colorado Springs), and Terrance E. Boult (Vision and Security Technology (VAST) Lab University of Colorado Colorado Springs)

HoloFace: Augmenting Human-to-Human Interactions on HoloLens 141 Marek Kowalski (Warsaw University of Technology), Zbigniew Nasarzewski (Warsaw University of Technology), Grzegorz Galinski (Warsaw University of Technology), and Piotr Garbat (Warsaw University of Technology)

Word Spotting in Silent Lip Videos 150 Abhishek Jha (IIIT Hyderabad), Vinay P. Namboodiri (IIT Kanpur), and C. V. Jawahar (IIIT Hyderabad)

vi

Learning to Generate 3D Stylized Character Expressions from Humans 160 Deepali Aneja (University of Washington), Bindita Chaudhuri (University of Washington), Alex Colburn (Zillow Group), Gary Faigin (Gage Academy of Art), Linda Shapiro (University of Washington), and Barbara Mones (University of Washington)

Oral 1B: Vision for X / Industrial / Documents

Image2GIF: Generating Cinemagraphs Using Recurrent Deep Q-Networks 170 Yipin Zhou (University of North Carolina at Chapel Hill), Yale Song (Yahoo Research), and Tamara L. Berg (University of North Carolina at Chapel Hill)

Large Scale Novel Object Discovery in 3D 179 Siddharth Srivastava (Indian Institute of Technology), Gaurav Sharma (Indian Institute of Technology), and Brejesh Lall (Indian Institute of Technology)

Towards Automated Transcription of Label Text from Pinned Insect Collections 189 Nitin Agarwal (University of California), Nicola Ferrier (Argonne National Laboratory), and Mark Hereld (Argonne National Laboratory)

Generating Handwritten Chinese Characters Using CycleGAN 199 Bo Chang (University of British Columbia), Qiong Zhang (University of British Columbia), Shenyi Pan (University of British Columbia), and Lili Meng (University of British Columbia)

A Method for Segmentation, Matching and Alignment of Dead Sea Scrolls 208 Gil Levi (Tel Aviv University), Pinhas Nisnevich (Tel Aviv University), Adiel Ben-Shalom (Tel Aviv University), Nachum Dershowitz (Tel Aviv University), and Lior Wolf (Tel Aviv University)

Confidence Prediction for Lexicon-Free OCR 218 Noam Mor (Tel Aviv University) and Lior Wolf (Tel Aviv University)

Efficient Training for Automatic Defect Classification by Image Augmentation 226 Naoaki Kondo (Hitachi), Minoru Harada (Hitachi), and Yuji Takagi (Hitachi)

Visual Weather Temperature Prediction 234 Wei-Ta Chu (National Chung Cheng University), Kai-Chia Ho (National Chung Cheng University), and Ali Borji (Center for Research in Computer Vision)

Robust and Accurate Text Stroke Segmentation 242 Siyang Qin (University of California Santa Cruz), Peng Ren (University of California Santa Cruz), Seongdo Kim (University of California Santa Cruz), and Roberto Manduchi (University of California Santa Cruz)

vii

Classification of Crop Lodging with Gray Level Co-occurrence Matrix 251 Sajith Rajapaksa (University of Saskatchewan Saskatoon), Mark Eramian (University of Saskatchewan Saskatoon), Hema Duddu (University of Saskatchewan Saskatoon), Menglu Wang (University of Saskatchewan Saskatoon), Steve Shirtliffe (University of Saskatchewan Saskatoon), Seungbum Ryu (University of Saskatchewan Saskatoon), Anique Josuttes (University of Saskatchewan Saskatoon), Ti Zhang (University of Saskatchewan Saskatoon), Sally Vail (Agriculture and Agri-food Canada Saskatoon Research and Development Center), Curtis Pozniak (University of Saskatchewan Saskatoon), and Isobel Parkin (Agriculture and Agri-food Canada Saskatoon Research and Development Center)

Automated Action Units Vs. Expert Raters: Face off 259 Svati Dhamija (University of Colorado Colorado Springs) and Terrance E. Boult (University of Colorado Colorado Springs)

Recommending Outfits from Personal Closet 269 Pongsate Tangseng (Tohoku University), Kota Yamaguchi (CyberAgent), and Takayuki Okatani (RIKEN Center for AIP)

SatTel: A Framework for Commercial Satellite Imagery Exploitation 278 Andrew D. Gilliam (Vision Systems Inc.), Thomas B. Pollard (Systems & Technology Research), Andrew Neff (Vision Systems Inc.), Yi Dong (Vision Systems Inc.), Scott Sorensen (Vision Systems Inc.), Robert Wagner (Vision Systems Inc.), Selene Chew (Systems & Technology Research), Todd V. Rovito (Air Force Research Lab), and Joseph L. Mundy (Vision Systems Inc.)

A Two-Point Method for PTZ Camera Calibration in Sports 287 Jianhui Chen (University of British Columbia), Fangrui Zhu (Tongji University), and James J. Little (University of British Columbia)

Towards Structured Analysis of Broadcast Badminton Videos 296 Anurag Ghosh (CVIT), Suriya Singh (CVIT), and C. V. Jawahar (CVIT)

Automated Top View Registration of Broadcast Football Videos 305 Rahul Anand Sharma (KCIS), Bharath Bhat (KCIS), Vineet Gandhi (KCIS), and C. V. Jawahar (KCIS)

Recognition of Pollen-Bearing Bees from Video Using Convolutional Neural Network 314 Iván F. Rodriguez (University of Puerto Rico), Rémi Mégret (University of Puerto Rico), Edgar Acuña (University of Puerto Rico), José L. Agosto-Rivera (University of Puerto Rico), and Tugrul Giray (University of Puerto Rico)

DeepWheat: Estimating Phenotypic Traits from Crop Images with Deep Learning 323 Shubhra Aich (Univ. Saskatchewan), Anique Josuttes (Univ. Saskatchewan), Ilya Ovsyannikov (Univ. Saskatchewan), Keegan Strueby (Univ. Saskatchewan), Imran Ahmed (Univ. Saskatchewan), Hema Sudhakar Duddu (Univ. Saskatchewan), Curtis Pozniak ( Univ. Saskatchewan), Steve Shirtliffe (Univ. Saskatchewan), and Ian Stavness (Univ. Saskatchewan)

viii

DeepSolarEye: Power Loss Prediction and Weakly Supervised Soiling Localization via FullyConvolutional Networks for Solar Panels 333 Sachin Mehta (University of Washington), Amar P. Azad (IBM Research Lab), Saneem A. Chemmengath (IBM Research Lab), Vikas Raykar (IBM Research Lab), and Shivkumar Kalyanaraman (IBM Research Lab)

Oral 1C: Action / Pose / Biometrics

Generic Tubelet Proposals for Action Localization 343 Jiawei He (Simon Fraser University), Zhiwei Deng (Simon Fraser University), Mostafa S. Ibrahim (Simon Fraser University), and Greg Mori (Simon Fraser University)

A Temporal Sequence Learning for Action Recognition and Prediction 352 Sangwoo Cho (University of Central Florida) and Hassan Foroosh (University of Central Florida)

ReHAR: Robust and Efficient Human Activity Recognition 362 Xin Li (Lehigh University) and Mooi Choo Chuah (Lehigh University)

A Generative Approach to Zero-Shot and Few-Shot Action Recognition 372 Ashish Mishra (Indian Institute of Technology Madras), Vinay Kumar Verma (Indian Institute of Technology Kanpur), M Shiva Krishna Reddy (Indian Institute of Technology Madras), Arulkumar S (Indian Institute of Technology Madras), Piyush Rai (Indian Institute of Technology Kanpur), and Anurag Mittal (Indian Institute of Technology Madras)

Learning to Detect Human-Object Interactions 381 Yu-Wei Chao (University of Michigan), Yunfan Liu (University of Michigan), Xieyang Liu (University of Michigan), Huayi Zeng (Washington University in St. Louis), and Jia Deng (University of Michigan)

Human Shape Capture and Tracking at Home 390 Gaurav Mishra ( IIIT Hyderabad), Saurabh Saini ( IIIT Hyderabad), Kiran Varanasi (IIIT Hyderabad), and P J Narayanan ( IIIT Hyderabad)

Recognizing Visual Signatures of Spontaneous Head Gestures 400 Mohit Sharma (Carnegie Mellon University), Dragan Ahmetovic (Carnegie Mellon University), László A. Jeni (Carnegie Mellon University), and Kris M. Kitani (Carnegie Mellon University)

Person Authentication Using Head Images 409 Aakarsh Malhotra (IIIT-Delhi), Richa Singh (IIIT-Delhi), Mayank Vatsa (IIIT-Delhi), and Vishal M. Patel (Rutgers University)

A Greedy Part Assignment Algorithm for Real-Time Multi-person 2D Pose Estimation 418 Srenivas Varadarajan (Intel Corporation), Parual Datta (Intel Corporation), and Omesh Tickoo (Intel Corporation)

Camera Selection for Broadcasting Soccer Games 427 Jianhui Chen (University of British Columbia), Lili Meng (University of British Columbia), and James J. Little (University of British Columbia)

ix

Using a Single RGB Frame for Real Time 3D Hand Pose Estimation in the Wild 436 Paschalis Panteleris (Institute of Computer Science), Iason Oikonomidis (Institute of Computer Science), and Antonis Argyros (University of Crete)

Activity-Conditioned Continuous Human Pose Estimation for Performance Analysis of Athletes Using theExample of Swimming 446 Moritz Einfalt (Multimedia Computing and Computer Vision Lab), Dan Zecha ( University of Augsburg), and Rainer Lienhart ( University of Augsburg)

A Hybrid Method for 3D Pose Estimation of Personalized Human Body Models 456 Ammar Qammaz ( University of Crete), Damien Michel (Institute of Computer Science), and Antonis Argyros (University of Crete)

Recurrent Autoregressive Networks for Online Multi-object Tracking 466 Kuan Fang (Stanford University), Yu Xiang (University of Washington), Xiaocheng Li (Stanford University), and Silvio Savarese (Stanford University)

Multichannel Attention Network for Analyzing Visual Behavior in Public Speaking 476 Rahul Sharma (IIT Kanpur), Tanaya Guha (IIT Kanpur), and Gaurav Sharma (IIT Kanpur)

Face Sketch Synthesis with Style Transfer Using Pyramid Column Feature 485 Chaofeng Chen (The University of Hong Kong), Xiao Tan (Baidu Research), and Kwan-Yee K. Wong (The University of Hong Kong)

Long-Term Person Re-identification Using True Motion from Videos 494 Peng Zhang (University of Technology Sydney), Qiang Wu (University of Technology Sydney), Jingsong Xu (University of Technology Sydney), and Jian Zhang (University of Technology Sydney)

Iris Presentation Attack via Textured Contact Lens in Unconstrained Environment 503 Daksha Yadav (West Virginia University), Naman Kohli (West Virginia University), Mayank Vatsa (West Virginia University), Richa Singh (West Virginia University), and Afzel Noore (IIIT-Delhi)

Oral 1D: Medical / Vehicles / Multimedia

Learning to See Through Turbulent Water 512 Zhengqin Li (University of California), Zak Murez (University of California), David Kriegman (University of California), Ravi Ramamoorthi (University of California), and Manmohan Chandraker (University of California)

FARSA: Fully Automated Roadway Safety Assessment 521 Weilian Song (University of Kentucky), Scott Workman (University of Kentucky), Armin Hadzic (University of Kentucky), Xu Zhang (University of Kentucky), Eric Green (University of Kentucky), Mei Chen (University of Kentucky), Reginald Souleyrette (University of Kentucky), and Nathan Jacobs (University of Kentucky)

Robust Adaptive Heart-Rate Monitoring Using Face Videos 530 Puneet Gupta (TCS Innovation Lab Kolkata), Brojeshwar Bhowmik (TCS Innovation Lab Kolkata), and Arpan Pal (TCS Innovation Lab Kolkata)

x

ScanNet: A Fast and Dense Scanning Framework for Metastastic Breast Cancer Detection fromWhole-Slide Image 539 Huangjing Lin (The Chinese University of Hong Kong), Hao Chen (Imsight Medical Technology Inc.), Qi Dou (The Chinese University of Hong Kong), Liansheng Wang (Xiamen University), Jing Qin (The Hong Kong Polytechnic University), and Pheng-Ann Heng (The Chinese University of Hong Kong)

Multi-modal Learning from Unpaired Images: Application to Multi-organ Segmentation in CT and MRI 547 Vanya V. Valindria (Imperial College London), Nick Pawlowski (Imperial College London), Martin Rajchl (Imperial College London), Ioannis Lavdas (Imperial College London), Eric O. Aboagye (Imperial College London), Andrea G. Rockall (The Royal Marsden NHS Foundation Trust), Daniel Rueckert (Imperial College London), and Ben Glocker (Imperial College London)

Learning Disentangled Multimodal Representations for the Fashion Domain 557 Amrita Saha (IBM Research), Megha Nawhal (Simon Fraser University), Mitesh M. Khapra (IIT Madras), and Vikas C. Raykar (IBM Research)

Wide-Slice Residual Networks for Food Recognition 567 Niki Martinel (Machine Learning an Perception Lab - University of Udine), Gian Luca Foresti (AViReS Lab - University of Udine), and Christian Micheloni (Machine Learning an Perception Lab - University of Udine)

Path Reducing Watershed for the GPU 577 Varduhi Yeghiazaryan ( University of Oxford) and Irina Voiculescu (University of Oxford)

Segmenting Root Systems in X-Ray Computed Tomography Images Using Level Sets 586 Amy Tabb (USDA-ARS-AFRS Kearneysville), Keith E. Duncan (Donald Danforth Plant Science Center St. Louis), and Christopher N. Topp (Donald Danforth Plant Science Center St. Louis)

Deep Radio-Visual Localization 596 Tatsuya Ishihara (Carnegie Mellon University), Kris M. Kitani (Carnegie Mellon University), Chieko Asakawa (IBM Research), and Michitaka Hirose (The University of Tokyo)

From Pixels to Actions: Learning to Drive a Car with Deep Neural Networks 606 Jonas Heylen (TRACE-Leuven), Seppe Iven ( ESAT-PSI), Bert De Brabandere ( ESAT-PSI), Jose Oramas M. ( ESAT-PSI), Luc Van Gool ( ESAT-PSI), and Tinne Tuytelaars ( ESAT-PSI)

PIVO: Probabilistic Inertial-Visual Odometry for Occlusion-Robust Navigation 616 Arno Solin (Aalto University), Santiago Cortés (Aalto University), Esa Rahtu (Tampere Univ. of Tech.), and Juho Kannala (Aalto University)

Semantic Labeling Based Vehicle Detection in Aerial Imagery 626 Kun Nie (Fraunhofer IOSB), Lars Sommer (Karlsruhe Institute of Technology), Arne Schumann (Fraunhofer IOSB), and Jurgen Beyerer (Fraunhofer IOSB)

Multi Feature Deconvolutional Faster R-CNN for Precise Vehicle Detection in Aerial Imagery 635 Lars Sommer (Fraunhofer IOSB), Arne Schumann (Fraunhofer IOSB), Tobias Schuchert (Fraunhofer IOSB), and Jürgen Beyerer (Karlsruhe Institute of Technology)

xi

A Joint 3D-2D Based Method for Free Space Detection on Roads 643 Suvam Patra (IIT Delhi), Pranjal Maheshwari (IIT Delhi), Shashank Yadav (IIT Delhi), Subhashis Banerjee (IIT Delhi), and Chetan Arora (IIT Delhi)

Vehicle Re-Identification by Adversarial Bi-Directional LSTM Network 653 Yi Zhou (University of East Anglia) and Ling Shao (University of East Anglia)

Learning to Segment Breast Biopsy Whole Slide Images 663 Sachin Mehta (University of Washington), Ezgi Mercan (University of Washington), Jamen Bartlett (University of Vermont), Donald Weaver (University of Vermont), Joann Elmore (University of Washington), and Linda Shapiro (University of Washington)

DeepLung: Deep 3D Dual Path Nets for Automated Pulmonary Nodule Detection and Classification 673 Wentao Zhu (University of California), Chaochun Liu (Baidu Research), Wei Fan (Tencent Medical AI Lab), and Xiaohui Xie (University of California)

Learning Generative Models of Tissue Organization with Supervised GANs 682 Ligong Han (Carnegie Mellon University), Robert F. Murphy (Carnegie Mellon University), and Deva Ramanan (Carnegie Mellon University)

Tool Detection and Operative Skill Assessment in Surgical Videos Using Region-Based ConvolutionalNeural Networks 691 Amy Jin (Stanford University), Serena Yeung (Stanford University), Jeffrey Jopling (Stanford University), Jonathan Krause (Stanford University), Dan Azagury (Stanford University), Arnold Milstein (Stanford University), and Li Fei-Fei (Stanford University)

Oral 2A: Machine Learning for Vision 1

Decoupled Learning for Conditional Adversarial Networks 700 Zhifei Zhang (University of Tennessee), Yang Song (University of Tennessee), and Hairong Qi (University of Tennessee)

Learning to Prune Filters in Convolutional Neural Networks 709 Qiangui Huang (University of Southern California), Kevin Zhou (Siemens Healthineers), Suya You (US Army Research Laboratory), and Ulrich Neumann (University of Southern California)

Structured GANs 719 Irad Peleg (Tel Aviv University) and Lior Wolf (Facebook)

Neural Algebra of Classifiers 729 Rodrigo Santa Cruz (Australian Centre for Robotic Vision), Basura Fernando (Australian Centre for Robotic Vision), Anoop Cherian (Mitsubishi Electric Research Labs), and Stephen Gould (Australian Centre for Robotic Vision)

SHADHO: Massively Scalable Hardware-Aware Distributed Hyperparameter Optimization 738 Jeffery Kinnison (University of Notre Dame), Nathaniel Kremer-Herman (University of Notre Dame), Douglas Thain (University of Notre Dame), and Walter Scheirer (University of Notre Dame)

xii

Deep Cosine Metric Learning for Person Re-identification 748 Nicolai Wojke (German Aerospace Center (DLR)) and Alex Bewley (University of Oxford)

Iterative Cross Learning on Noisy Labels 757 Bodi Yuan (UC Berkeley), Jianyu Chen (UC Berkeley), Weidong Zhang (JD.COM American Technologies Corporation), Hung-Shuo Tai (JD.COM American Technologies Corporation), and Sara McMains (UC Berkeley)

A Simple yet Effective Model for Zero-Shot Learning 766 Xi Hang Cao (HRL Laboratories), Zoran Obradovic (Center for Data Analytics and Biomedical Informatics), and Kyungnam Kim (HRL Laboratories)

Fading Affect Bias: Improving the Trade-off Between Accuracy and Efficiency in Feature Clustering 775 Ziyin Wang (Indiana University-Purdue University Indianapolis), Sepehr Farhand (Indiana University-Purdue University Indianapolis), and Gavriil Tsechpenakis (Indiana University-Purdue University Indianapolis)

A Rotationally-Invariant Convolution Module by Feature Map Back-Rotation 784 Patrick Follmann (MVTec Software GmbH) and Tobias Bottger (MVTec Software GmbH)

Learning Image Representations by Completing Damaged Jigsaw Puzzles 793 Dahun Kim (KAIST), Donghyeon Cho (KAIST), Donggeun Yoo (KAIST), and In So Kweon (KAIST)

Towards Robust Deep Neural Networks with BANG 803 Andras Rozsa (Vision and Security Technology (VAST) Lab University of Colorado), Manuel Günther (Vision and Security Technology (VAST) Lab University of Colorado), and Terrance E. Boult (Vision and Security Technology (VAST) Lab University of Colorado)

Learning Higher Order Potentials for MRFs 812 Dinesh Khandelwal (IIT Delhi), Parag Singla (IIT Delhi), and Chetan Arora (IIT Delhi)

Hybrid Binary Networks: Optimizing for Accuracy, Efficiency and Memory 821 Ameya Prabhu (IIIT-Hyderabad), Vishal Batchu (IIIT-Hyderabad), Rohit Gajawada (IIIT-Hyderabad), Sri Aurobindo Munagala (IIIT-Hyderabad), and Anoop Namboodiri (IIIT-Hyderabad)

Distribution-Aware Binarization of Neural Networks for Sketch Recognition 830 Ameya Prabhu (IIIT-Hyderabad), Vishal Batchu (IIIT-Hyderabad), Sri Aurobindo Munagala (IIIT-Hyderabad), Rohit Gajawada (IIIT-Hyderabad), and Anoop Namboodiri (IIIT-Hyderabad)

Grad-CAM++: Generalized Gradient-Based Visual Explanations for Deep Convolutional Networks 839 Aditya Chattopadhay (IIT Hyderabad), Anirban Sarkar (IIT Hyderabad), Prantik Howlader (Cisco Systems), and Vineeth N Balasubramanian (IIT Hyderabad)

Recovering from Random Pruning: On the Plasticity of Deep Convolutional Neural Networks 848 Deepak Mittal (Indian Institute of Technology Madras), Shweta Bhardwaj (Indian Institute of Technology Madras), Mitesh M. Khapra (Indian Institute of Technology Madras), and Balaraman Ravindran (Indian Institute of Technology Madras)

xiii

Oral 2B: 3D / Geometry

DeformNet: Free-Form Deformation Network for 3D Shape Reconstruction from a Single Image 858 Andrey Kurenkov (Stanford Vision and Learning Lab), Jingwei Ji (Stanford Vision and Learning Lab), Animesh Garg (Stanford Vision and Learning Lab), Viraj Mehta (Stanford Vision and Learning Lab), JunYoung Gwak (Stanford Vision and Learning Lab), Christopher Choy (Stanford Vision and Learning Lab), and Silvio Savarese (Stanford Vision and Learning Lab)

Multi-view Stereo 3D Edge Reconstruction 867 Andrea Bignoli (Politecnico di Milano), Andrea Romanoni (Politecnico di Milano), Matteo Matteucci (Politecnico di Milano), and Politecnico di Milano (Politecnico di Milano)

Vector Graph Representation for Deformation Transfer Using Poisson Interpolation 876 Prashant Domadiya (Dhirubhai Ambani Institute of Information and Communication Technology), Pratik Shah (Indian Institute of Information Technology), and Suman K Mitra (Dhirubhai Ambani Institute of Information and Communication Technology)

Real-Time Simultaneous 3D Reconstruction and Optical Flow Estimation 885 Menandro Roxas (Institute of Industrial Science) and Takeshi Oishi (Institute of Industrial Science)

Object-Centric Photometric Bundle Adjustment with Deep Shape Prior 894 Rui Zhu (The Robotics Institute), Chaoyang Wang (The Robotics Institute), Chen-Hsuan Lin (The Robotics Institute), Ziyan Wang (The Robotics Institute), and Simon Lucey (The Robotics Institute)

Minimal Solvers for Monocular Rolling Shutter Compensation Under Ackermann Motion 903 Pulak Purkait (Toshiba Research Europe) and Christopher Zach (Toshiba Research Europe)

Real-Time Variational Range Image Fusion and Visualization for Large-Scale Scenes Using GPU HashTables 912 Nico Marniok (University of Konstanz) and Bastian Goldluecke (University of Konstanz)

Multi-pattern Embedded Phase Shifting Using a High-Speed Projector for Fast and Accurate Dynamic 3DMeasurement 921 Michika Maruyama (The University of Tokyo), Satoshi Tabata (The University of Tokyo), and Yoshihiro Watanabe (The University of Tokyo)

Robust and User Friendly 3D Re-Construction of Neutron Tomographic Images 930 Hao Song (University of Saskatchewan), Mark Eramian (University of Saskatchewan), Emil Hallin (University of Saskatchewan), Blanche Leyeza (University of Saskatchewan), Paul G. Arnison (University of Saskatchewan), and Ronald Rogge (Canadian Nuclear Labs)

Supervised Deep-Autoencoder for Depth Image-Based 3D Model Retrieval 939 Ayesha Siddiqua (Oklahoma State University) and Guoliang Fan (Xian University of Technology)

Minimal Non-Linear Camera Pose Estimation Method Using Lines for SLAM Application 947 Yu Cao (Beihang University), Haishu Tan (Foshan University), and Fuqiang Zhou (Beihang University)

xiv

Incremental Structural Modeling Based on Geometric and Statistical Analyses 955 Rafael Roberto (Universidade Federal de Pernambuco), João Paulo Lima (Universidade Federal de Pernambuco), Hideaki Uchiyama (Kyushu University), Clemens Arth (Technische Universitat Graz), Veronica Teichrieb (Universidade Federal de Pernambuco), Rin-ichiro Taniguchi (Kyushu University), and Dieter Schmalstieg (Technische Universitat Graz)

Reliability Map Estimation for CNN-Based Camera Model Attribution 964 David Güera (Purdue University), Fengqing Zhu (Purdue University), Sri Kalyan Yarlagadda (Purdue University), Stefano Tubaro (Politecnico di Milano), Paolo Bestagini (Politecnico di Milano), and Edward J. Delp (Purdue University)

DGSAC: Density Guided Sampling and Consensus 974 Lokender Tiwari (IIIT-Delhi) and Saket Anand (IIIT-Delhi)

An Epipolar Line from a Single Pixel 983 Tavi Halperin (The Hebrew University of Jerusalem) and Michael Werman (The Hebrew University of Jerusalem)

Efficient Map Compression for Collaborative Visual SLAM 992 Dominik Van Opdenbosch (Technical University of Munich), Tamay Aykut (Technical University of Munich), Nicolas Alt ( Technical University of Munich), and Eckehard Steinbach (Technical University of Munich)

Detect-SLAM: Making Object Detection and SLAM Mutually Beneficial 1001 Fangwei Zhong (Peking University), Sheng Wang (Peking University), Ziqi Zhang (Peking University), China Chen (Peking University), and Yizhou Wang (Peking University)

Improvement of Extrinsic Parameters from a Single Stereo Pair 1011 Andreas Kuhn (Bundeswehr University Munich), Lukas Roth (Bundeswehr University Munich), Jan-Michael Frahm (University of North Carolina at Chapel Hill), and Helmut Mayer (Bundeswehr University Munich)

Oral 2C: Tracking / Detection

Object Detection in Real-Time Systems: Going Beyond Precision 1020 Anupam Sobti (IIT Delhi), Chetan Arora (IIIT Delhi), and M. Balakrishnan (IIT Delhi)

Graph-Based Correlated Topic Model for Trajectory Clustering in Crowded Videos 1029 Manal Al Ghamdi (Umm Al-Qura University) and Yoshihiko Gotoh (University of Sheffield)

Dynamic Visual Sequence Prediction with Motion Flow Networks 1038 Dinghuang Ji (The University of North Carolina at Chapel Hill), Zheng Wei (The University of North Carolina at Chapel Hill), Enrique Dunn (Stevens Institute of Technology), and Jan Michael Frahm (The University of North Carolina at Chapel Hill)

xv

Rotation Adaptive Visual Object Tracking with Motion Consistency 1047 Litu Rout (Indian Institute of Space Science and Technology), _ Siddhartha (Indian Institute of Space Science and Technology), Deepak Mishra (Indian Institute of Space Science and Technology), and Rama Krishna Sai Subrahmanyam Gorthi (Indian Institute of Technology)

SceneFlowFields: Dense Interpolation of Sparse Scene Flow Correspondences 1056 René Schuster (DFKI - German Research Center for Artificial Intelligence), Oliver Wasenmüller (DFKI - German Research Center for Artificial Intelligence), Georg Kuschk (BMW Group), Christian Bailer (DFKI - German Research Center for Artificial Intelligence), and Didier Stricker (DFKI - German Research Center for Artificial Intelligence)

LBP Channels for Pedestrian Detection 1066 Remi Trichet (INRIA) and Francois Bremond (INRIA)

An Animal Detection Pipeline for Identification 1075 Jason Parham (Rensselaer Polytechnic Institute), Charles Stewart (Rensselaer Polytechnic Institute), Jonathan Crall (Kitware), Daniel Rubenstein (Princeton University), Jason Holmberg (Wild Me), and Tanya Berger-Wolf (University of Illinois-Chicago)

Rotational Rectification Network: Enabling Pedestrian Detection for Mobile Vision 1084 Xinshuo Weng (Carnegie Mellon University), Shangxuan Wu (Carnegie Mellon University), Fares Beainy (Volvo Construction Equipment), and Kris M. Kitani (Carnegie Mellon University)

StairNet: Top-Down Semantic Aggregation for Accurate One Shot Detection 1093 Sanghyun Woo (KAIST), Soonmin Hwang (KAIST), and In So Kweon (KAIST)

SmartPartNet: Part-Informed Person Detection for Body-Worn Smartphones 1103 Heng Yu (Tsinghua University), Eshed Ohn-Bar (Carnegie Mellon University), Donghyun Yoo (Carnegie Mellon University), and Kris M. Kitani (Carnegie Mellon University)

Crowd Counting via Scale-Adaptive Convolutional Neural Network 1113 Lu Zhang (Tencent Youtu), Miaojing Shi (Inria Rennes & Tencent Youtu), and Qiaobo Chen (Shanghai Jiaotong University)

Tracking by Prediction: A Deep Generative Model for Mutli-person Localisation and Tracking 1122 Tharindu Fernando (Queensland University of Technology), Simon Denman (Queensland University of Technology), Sridha Sridharan (Queensland University of Technology), and Clinton Fookes (Queensland University of Technology)

EnKCF: Ensemble of Kernelized Correlation Filters for High-Speed Object Tracking 1133 Burak Uzkent (Rochester Institute of Technology) and YoungWoo Seo (Independent Robotics Research (IR2))

Tracking an RGB-D Camera on Mobile Devices Using an Improved Frame-to-Frame Pose Estimation Method 1142 Jaepung An (Sogang University), Jaehyun Lee (TmaxOS Korea), Jiman Jeong (TmaxOS Korea), and Insung Ihm (Sogang University)

xvi

Crowd Counting with Minimal Data Using Generative Adversarial Networks for Multiple TargetRegression 1151 Greg Olmschenk (The Graduate Center of the City University of New York), Hao Tang (Borough of Manhattan Community College - CUNY), and Zhigang Zhu (The City College of New York - CUNY)

An Order Preserving Bilinear Model for Person Detection in Multi-Modal Data 1160 Oytun Ulutan (University of California), Benjamin S. Riggan (US Army Research Lab), Nasser M. Nasrabadi (West Virginia University), and B. S. Manjunath (University of California)

Salient Region-Based Online Object Tracking 1170 Hyemin Lee (POSTECH) and Daijin Kim (POSTECH)

"Seeing is Believing": Pedestrian Trajectory Forecasting Using Visual Frustum of Attention 1178 Irtiza Hasan (University of Verona (UNIVR)), Francesco Setti (University of Verona (UNIVR)), Theodore Tsesmelis (University of Verona (UNIVR)), Alessio Del Bue (Istituto Italiano di Tecnologia (IIT)), Marco Cristani (University of Verona (UNIVR)), and Fabio Galasso (OSRAM GmbH)

SS-LSTM: A Hierarchical LSTM Model for Pedestrian Trajectory Prediction 1186 Hao Xue (The University of Western Australia), Du Q. Huynh (The University of Western Australia), and Mark Reynolds (The University of Western Australia)

Oral 2D: Machine Learning for Vision 2

Channel-Recurrent Autoencoding for Image Modeling 1195 Wenling Shang (University of Amsterdam), Kihyuk Sohn (NEC Labs), and Yuandong Tian (Facebook AI Research)

Factorized Convolutional Networks: Unsupervised Fine-Tuning for Image Clustering 1205 Liang-Yan Gui (Carnegie Mellon University), Liangke Gui (Carnegie Mellon University), Yu-Xiong Wang (Carnegie Mellon University), Louis-Philippe Morency (Carnegie Mellon University), and José M. F. Moura (Carnegie Mellon University)

A Semi-Supervised Two-Stage Approach to Learning from Noisy Labels 1215 Yifan Ding (University of Central Florida), Liqiang Wang (University of Central Florida), Deliang Fan (University of Central Florida), and Boqing Gong (Tencent AI Lab Bellevue)

Look-Up Table Unit Activation Function for Deep Convolutional Neural Networks 1225 Min Wang (University of Central Florida), Baoyuan Liu (Amazon.com), and Hassan Foroosh (University of Central Florida)

Soft-Cascade Learning with Explicit Computation Time Considerations 1234 Francisco Rodolfo Barbosa-Anda (LAAS-CNRS), Frédéric Lerasle (LAAS-CNRS), Cyril Briand (LAAS-CNRS), and Alhayat Ali Mekonnen (LAAS-CNRS)

BranchConnect: Image Categorization with Learned Branch Connections 1244 Karim Ahmed (Dartmouth College) and Lorenzo Torresani (Dartmouth College)

xvii

Gabor Convolutional Networks 1254 Shangzhen Luan (Beihang University), Baochang Zhang (Beihang University), Siyue Zhou (Beihang University), Chen Chen (University of Central Florida), Jungong Han (Lancaster University), Wankou Yang (Southeast University), and Jianzhuang Liu (Huawei)

QRkit: Sparse, Composable QR Decompositions for Efficient and Stable Solutions to Problems inComputer Vision 1263 Jan Svoboda (USI Lugano), Thomas Cashman (Microsoft HoloLens), and Andrew Fitzgibbon (Microsoft HoloLens)

Multi-task Spatiotemporal Neural Networks for Structured Surface Reconstruction 1273 Mingze Xu (Indiana University), Chenyou Fan (Indiana University), John D. Paden (University of Kansas), Geoffrey C. Fox (Indiana University), and David J. Crandall (Indiana University)

Driving Scene Perception Network: Real-Time Joint Detection, Depth Estimation and SemanticSegmentation 1283 Liangfu Chen (Harman International), Zeng Yang (Harman International), Jianjun Ma (Harman International), and Zheng Luo (University of Virginia)

A Deep Four-Stream Siamese Convolutional Neural Network with Joint Verification and IdentificationLoss for Person Re-Detection 1292 Amena Khatun (Queensland University of Technology), Simon Denman (Queensland University of Technology), Sridha Sridharan (Queensland University of Technology), and Clinton Fookes (Queensland University of Technology)

Robust Subspace Clustering by Bi-Sparsity Pursuit: Guarantees and Sequential Algorithm 1302 Ashkan Panahi (North Carolina State University), Xiao Bian (North Carolina State University), Hamid Krim (North Carolina State University), and Liyi Dai (U.S. Army Research Office)

Adversarial Training of Variational Auto-Encoders for High Fidelity Image Generation 1312 Salman H. Khan (Data61 - CSIRO and ANU), Munawar Hayat (University of Canberra), and Nick Barnes (Data61 - CSIRO and ANU)

Learning Confidence Measures by Multi-modal Convolutional Neural Networks 1321 Zehua Fu (Université de Lyon - Ecole Centrale de Lyon) and Mohsen Ardabilian Fard (Université de Lyon - Ecole Centrale de Lyon)

A Compact Convolutional Neural Network for Textured Surface Anomaly Detection 1331 Domen Racki (Sensum), Dejan Tomaževic (University of Ljubljana), and Danijel Skocaj (University of Ljubljana)

How Much Chemistry Does a Deep Neural Network Need to Know to Make Accurate Predictions? 1340 Garrett B. Goh (Pacific Northwest National Lab), Charles Siegel (Pacific Northwest National Lab), Abhinav Vishnu (Pacific Northwest National Lab), Nathan Hodas (Pacific Northwest National Lab), and Nathan Baker (Pacific Northwest National Lab)

Balancing Content and Style with Two-Stream FCNs for Style Transfer 1350 Duc Minh Vo (SOKENDAI (The Graduate University for Advanced Studies)), Trung-Nghia Le (SOKENDAI (The Graduate University for Advanced Studies)), and Akihiro Sugimoto (National Institute of Informatics)

xviii

Oral 3A: Segmentation / Saliency / Super-Resolution

DARN: A Deep Adversarial Residual Network for Intrinsic Image Decomposition 1359 Louis Lettry (ETH Zurich), Kenneth Vanhoey (ETH Zurich), and Luc van Gool (ETH Zurich)

Saliency Driven Image Manipulation 1368 Roey Mechrez (Technion), Eli Shechtman (Adobe Research), and Lihi Zelnik-Manor (Technion)

Depth Map Completion by Jointly Exploiting Blurry Color Images and Sparse Depth Maps 1377 Liyuan Pan (Northwestern Polytechnical University), Yuchao Dai (Australian National University), Miaomiao Liu (Data61), and Fatih Porikli (Australian National University)

Learning to Detect Multiple Photographic Defects 1387 Ning Yu (University of Virginia), Xiaohui Shen (Adobe Research), Zhe Lin (Adobe Research), Radomír Mech (Adobe Research), and Connelly Barnes (University of Virginia)

C^2MSNet: A Novel Approach for Single Image Haze Removal 1397 Akshay Dudhane (Indian Institute of Technology Ropar) and Subrahmanyam Murala (Indian Institute of Technology Ropar)

Stabilizing First Person 360 Degree Videos 1405 Chetan Arora (IIIT Delhi) and Vivek Kwatra (Google Research)

Super-Resolution for Overhead Imagery Using DenseNets and Adversarial Learning 1414 Marc Bosch (The Johns Hopkins University Applied Physics Laboratory), Christopher M. Gifford (The Johns Hopkins University Applied Physics Laboratory), and Pedro A. Rodriguez (The Johns Hopkins University Applied Physics Laboratory)

CT-SRCNN: Cascade Trained and Trimmed Deep Convolutional Neural Networks for Image Super Resolution 1423 Haoyu Ren (Samsung Semiconductor Inc.), Mostafa El-Khamy (Samsung Semiconductor Inc.), and Jungwon Lee (Samsung Semiconductor Inc.)

Towards the Success Rate of One: Real-Time Unconstrained Salient Object Detection 1432 Mahyar Najibi (University of Maryland College Park), Fan Yang (eBay Inc.), Qiaosong Wang (eBay Inc), and Robinson Piramuthu (eBay Inc.)

Effective Use of Dilated Convolutions for Segmenting Small Object Instances in Remote SensingImagery 1442 Ryuhei Hamaguchi (PASCO CORPORATION), Aito Fujita (PASCO CORPORATION), Keisuke Nemoto (PASCO CORPORATION), Tomoyuki Imaizumi (PASCO CORPORATION), and Shuhei Hikosaka (PASCO CORPORATION)

Understanding Convolution for Semantic Segmentation 1451 Panqu Wang (TuSimple), Pengfei Chen (TuSimple), Ye Yuan (Carnegie Mellon University), Ding Liu (University of Illinois Urbana-Champaign), Zehua Huang (TuSimple), Xiaodi Hou (TuSimple), and Garrison Cottrell (UC San Diego)

Learning Semantic Segmentation with Diverse Supervision 1461 Linwei Ye (University of Manitoba), Zhi Liu (Shanghai University), and Yang Wang (University of Manitoba)

xix

Image Segmentation Using Sparse Subset Selection 1470 Fariba Zohrizadeh (University of Texas at Arlington), Mohsen Kheirandishfard (University of Texas at Arlington), and Farhad Kamangar (University of Texas at Arlington)

Light-Field Surface Color Segmentation with an Application to Intrinsic Decomposition 1480 Elena Garces (Technicolor) and Erik Reinhard (Technicolor)

Unsupervised Clustering Guided Semantic Segmentation 1489 Qin Huang (University of Southern California), Chunyang Xia (University of Southern California), Siyang Li (University of Southern California), Ye Wang (University of Southern California), Yuhang Song (University of Southern California), and C.-C. Jay Kuo (University of Southern California)

Ensemble Knowledge Transfer for Semantic Segmentation 1499 Ishan Nigam (Carnegie Mellon University), Chen Huang (Carnegie Mellon University), and Deva Ramanan (Carnegie Mellon University)

Segmentation and Shape Extraction from Convolutional Neural Networks 1509 Mai Lan Ha (University of Siegen), Gianni Franchi (University of Siegen), Michael Möller (University of Siegen), Andreas Kolb (University of Siegen), and Volker Blanz (University of Siegen)

Where and Who? Automatic Semantic-Aware Person Composition 1519 Fuwen Tan (University of Virginia), Crispin Bernier (University of Virginia), Benjamin Cohen (University of Virginia), Vicente Ordonez (University of Virginia), and Connelly Barnes (Adobe Research)

Saliency Prediction for Mobile User Interfaces 1529 Prakhar Gupta (Adobe Research), Shubh Gupta (IIT Kanpur), Ajaykrishnan Jayagopal (IIT Madras), Sourav Pal (IIT Kharagpur), and Ritwik Sinha (Adobe Research)

Task Specific Visual Saliency Prediction with Memory Augmented Conditional Generative AdversarialNetworks 1539 Tharindu Fernando (Queensland University of Technology (QUT)), Simon Denman (Queensland University of Technology (QUT)), Sridha Sridharan (Queensland University of Technology (QUT)), and Clinton Fookes (Queensland University of Technology (QUT))

Oral 3B: Action Recognition / Surveillance / Language

Modeling Temporal Structure with LSTM for Online Action Detection 1549 Roeland De Geest (KU Leuven) and Tinne Tuytelaars (KU Leuven)

End-to-End Fine-Grained Action Segmentation and Recognition Using Conditional Random Field Modelsand Discriminative Sparse Coding 1558 Effrosyni Mavroudi (Johns Hopkins University), Divya Bhaskara (University of Virginia), Shahin Sefati (Comcast AI Research), Haider Ali (Johns Hopkins University), and René Vidal (Johns Hopkins University)

xx

Scaling Human-Object Interaction Recognition Through Zero-Shot Learning 1568 Liyue Shen (Stanford University), Serena Yeung (Stanford University), Judy Hoffman (UC Berkeley), Greg Mori (Simon Fraser University), and Li Fei-Fei (Stanford University)

Temporal Difference Networks for Video Action Recognition 1587 Joe Yue-Hei Ng (University of Maryland) and Larry S. Davis (University of Maryland)

UG^2: A Video Benchmark for Assessing the Impact of Image Restoration and Enhancement on AutomaticVisual Recognition 1597 Rosaura G. Vidal (University of Notre Dame), Sreya Banerjee (University of Notre Dame), Klemen Grm (University of Ljubljana), Vitomir Štruc (University of Ljubljana), and Walter J. Scheirer (University of Notre Dame)

Fully-Coupled Two-Stream Spatiotemporal Networks for Extremely Low Resolution Action Recognition 1607 Mingze Xu (Indiana University), Aidean Sharghi (University of Central Florida), Xin Chen (Midea Corporate Research Center), and David J. Crandall (Indiana University)

ActionFlowNet: Learning Motion Representation for Action Recognition 1616 Joe Yue-Hei Ng (University of Maryland), Jonghyun Choi (Allen Institute for AI), Jan Neumann (Comcast Labs), and Larry S. Davis (University of Maryland)

Structural Recurrent Neural Network (SRNN) for Group Activity Analysis 1625 Sovan Biswas (University of Bonn) and Juergen Gall (University of Bonn)

Instance-Aware Detailed Action Labeling in Videos 1577 Hongtao Yang (The Australian National University), Xuming He (ShanghaiTech University), and Fatih Porikli (The Australian National University)

Learning Hierarchical Models of Complex Daily Activities from Annotated Videos 1633 Jawad Tayyub (University of Leeds), Majd Hawasly (Five AI), David C. Hogg (University of Leeds), and Anthony G. Cohn (University of Leeds)

ReMotENet: Efficient Relevant Motion Event Detection for Large-Scale Home Surveillance Videos 1642 Ruichi Yu (University of Maryland), Hongcheng Wang (Comcast Applied AI Research), and Larry S. Davis (University of Maryland)

Foot Contact Timings and Step Length for Sprint Training 1652 Murray Evans (University of Bath), Steffi Colyer (University of Bath), Darren Cosker (University of Bath), and Aki Salo (University of Bath)

Illumination-Invariant Robust Multiview 3D Human Motion Capture 1661 Nadia Robertini (Intel Visual Computing Institute), Florian Bernard (MPI for Informatics), Weipeng Xu (MPI for Informatics), and Christian Theobalt (MPI for Informatics)

Efficient Multi-attribute Similarity Learning Towards Attribute-Based Fashion Search 1671 Kenan E. Ak (National University of Singapore), Joo Hwee Lim (Institute for Infocomm Research), Jo Yew Tham (ESP xMedia Pte. Ltd.), and Ashraf A. Kassim (National University of Singapore)

xxi

CSVideoNet: A Real-Time End-to-End Learning Framework for High-Frame-Rate Video Compressive Sensing 1680 Kai Xu (Arizona State University) and Fengbo Ren (Arizona State University)

Plug-and-Play CNN for Crowd Motion Analysis: An Application in Abnormal Event Detection 1689 Mahdyar Ravanbakhsh (University of Genova), Moin Nabi (University of Trento), Hossein Mousavi (Istituto Italiano di Tecnologia), Enver Sangineto (University of Trento), and Nicu Sebe (University of Trento)

Disjoint Multi-task Learning Between Heterogeneous Human-Centric Tasks 1699 Dong-Jin Kim (KAIST), Jinsoo Choi (KAIST), Tae-Hyun Oh (MIT CSAIL), Youngjin Yoon (KAIST), and In So Kweon (KAIST)

Fine-Grained and Semantic-Guided Visual Attention for Image Captioning 1709 Zongjian Zhang (University of Technology Sydney), Qiang Wu (University of Technology Sydney), Yang Wang (Data61-CSIRO), and Fang Chen (Data61-CSIRO)

Contextually Customized Video Summaries Via Natural Language 1718 Jinsoo Choi (KAIST EE), Tae-Hyun Oh (MIT CSAIL), and In So Kweon (KAIST EE)

Oral 3C: Vision and Learning, Languages, Applications

Learning Video-Story Composition via Recurrent Neural Network 1727 Guangyu Zhong ( Dalian University of Technology), Yi-Hsuan Tsai (NEC Labs America), Sifei Liu (NVIDIA Research), Zhixun Su ( Dalian University of Technology), and Ming-Hsuan Yang (University of California, Merced)

Discriminative Cross-View Binary Representation Learning 1736 Liu Liu (University of Tennessee) and Hairong Qi (University of Tennessee)

Unsupervised Object Discovery for Instance Recognition 1745 Oriane Siméoni (Inria Rennes), Ahmet Iscen (CTU in Prague), Giorgos Tolias (CTU in Prague), Yannis Avrithis (Inria Rennes), and Ondrej Chum (CTU in Prague)

Video Inpainting for Arbitrary Foreground Object Removal 1755 Ashraf Siddique (KyungHee University) and Seungkyu Lee (KyungHee University)

Aesthetic Inference for Smart Mobile Devices 1764 Michal Kucer (Rochester Institute of Technology) and David W. Messinger (Rochester Institute of Technology)

Improving Object Classification Performance via Confusing Categories Study 1774 Shangwen Li (University of Southern California), Chen Chen (University of Southern California), Yuzhuo Ren (University of Southern California), and C.-C. Jay Kuo (University of Southern California)

Context-Aware Single-Shot Detector 1784 Wei Xiang (University of Texas at Arlington), Dong-Qing Zhang (Media Lab), Heather Yu (Media Lab), and Vassilis Athitsos (University of Texas at Arlington)

xxii

The More You Look, the More You See: Towards General Object Understanding Through RecursiveRefinement 1794 Jingyan Wang (Carnegie Mellon University), Olga Russakovsky (Princeton University), and Deva Ramanan (Carnegie Mellon University)

ByLabel: A Boundary Based Semi-Automatic Image Annotation Tool 1804 Xuebin Qin (University of Alberta), Shida He (University of Alberta), Zichen Zhang (University of Alberta), Masood Dehghan (University of Alberta), and Martin Jagersand (University of Alberta)

Object-Based Reasoning in VQA 1814 Mikyas T. Desta (IBM Research), Larry Chen (University of Chicago), and Tomasz Kornuta (IBM Research)

Generative and Discriminative Sparse Coding for Image Classification Applications 1824 Ajit Puthenputhussery (New Jersey Institute of Technology), Qingfeng Liu (New Jersey Institute of Technology), Hao Liu (New Jersey Institute of Technology), and Chengjun Liu (New Jersey Institute of Technology)

Distributed Active Learning for Image Recognition 1833 Shayok Chakraborty (Florida State University)

Retweet Wars: Tweet Popularity Prediction via Dynamic Multimodal Regression 1842 Ke Wang (University of North Carolina), Mohit Bansal (University of North Carolina), and Jan-Michael Frahm (University of North Carolina)

Semantically Guided Visual Question Answering 1852 Handong Zhao (Northeastern University), Quanfu Fan (IBM T. J. Watson Research Center), Dan Gutfreund (IBM T. J. Watson Research Center), and Yun Fu (Northeastern University)

Object Referring in Visual Scene with Spoken Language 1861 Arun Balajee Vasudevan (ETH Zurich) and Dengxin Dai (ETH Zurich)

Fast Self-Attentive Multimodal Retrieval 1871 Jônatas Wehrmann (Pontifícia Universidade Católica do Rio Grande do Sul), Maurício A. Lopes (Pontifícia Universidade Católica do Rio Grande do Sul), Martin D. More (Pontifícia Universidade Católica do Rio Grande do Sul), and Rodrigo C. Barros (Pontifícia Universidade Católica do Rio Grande do Sul)

Improving Text-Based Person Search by Spatial Matching and Adaptive Threshold 1879 Tianlang Chen (University of Rochester), Chenliang Xu (University of Rochester), and Jiebo Luo (University of Rochester)

Structured Triplet Learning with POS-Tag Guided Attention for Visual Question Answering 1888 Zhe Wang (UC Irvine), Xiaoyi Liu (Microsoft), Limin Wang (ETH Zurich), Yu Qiao (SIAT), Xiaohui Xie (UC Irvine), and Charless Fowlkes (UC Irvine)

Oral 3D: Features / Detection / Shape / Non-RGB

Chainlets: A New Descriptor for Detection and Recognition 1897 Adil Ahmad (Vision and Securty Technology (VAST) Lab), Daniel Lemmond ( Univeristy of Colorado Colroado Springs), and Terrance E. Boult (Vision and Securty Technology (VAST) Lab)

xxiii

Image Copy-Move Forgery Detection via an End-to-End Deep Neural Network 1907 Yue Wu (University of Southern California), Wael Abd-Almageed (University of Southern California), and Prem Natarajan (University of Southern California)

Anomaly Explanation Using Metadata 1916 Di Qi (Princeton U.), Joshua Arfin (North Carolina State U.), Mengxue Zhang (Ohio State U.), Tushar Mathew (AI Software), Robert Pless (George Washington U.), and Brendan Juba (Washington U. in St. Louis)

3D Shape Processing by Convolutional Denoising Autoencoders on Local Patches 1925 Kripasindhu Sarkar (DFKI - German Research Center for Artificial Intelligence), Kiran Varanasi (DFKI - German Research Center for Artificial Intelligence), and Didier Stricker (Technische Universität Kaiserslautern)

Fast and Robust Curve Skeletonization for Real-World Elongated Objects 1935 Amy Tabb (USDA-ARS-AFRS Kearneysville) and Henry Medeiros (Marquette University)

NCC-Net: Normalized Cross Correlation Based Deep Matcher with Robustness to Illumination Variations 1944 Arulkumar Subramaniam (Indian Institute of Technology Madras Chennai), Prashanth Balasubramanian (Indian Institute of Technology Madras Chennai), and Anurag Mittal (Indian Institute of Technology Madras Chennai)

Guided Filtering of Hyperspectral Images 1954 Sanjay Ghosh (Indian Institute of Science) and Naveen Tripathi Tripathi (Indian Institute of Technology Guwahati)

RGBD Camera Based Material Recognition via Surface Roughness Estimation 1963 Jungjun Kim (KyungHee University), Hwasup Lim (KIST), Sang Chul Ahn (KIST), and Seungkyu Lee (KyungHee University)

General-Purpose Deep Point Cloud Feature Extractor 1972 Miguel Dominguez (Rochester Institute of Technology), Rohan Dhamdhere (Rochester Institute of Technology), Atir Petkar (Rochester Institute of Technology), Saloni Jain (Rochester Institute of Technology), Shagan Sah (Rochester Institute of Technology), and Raymond Ptucha (Rochester Institute of Technology)

Synthetic to Real Adaptation with Generative Correlation Alignment Networks 1982 Xingchao Peng (Boston University) and Kate Saenko (Boston University)

Effective Combination of Vertical and Horizontal Stereo Vision 1992 Jan Kallwies (University of the Bundeswehr Munich) and Hans-Joachim Wuensche (University of the Bundeswehr Munich)

Chess Piece Recognition Using Oriented Chamfer Matching with a Comparison to CNN 2001 Youye Xie (Colorado School of Mines), Gongguo Tang (Colorado School of Mines), and William Hoff (Colorado School of Mines)

Delay Compensation for Actuated Stereoscopic 360 Degree Telepresence Systems with Probabilistic HeadMotion Prediction 2010 Tamay Aykut (Technical University of Munich), Christoph Burgmair (Technical University of Munich), Mojtaba Karimi (Technical University of Munich), Jingyi Xu (Technical University of Munich), and Eckehard Steinbach (Technical University of Munich)

xxiv

Automatic Analysis of Sewer Pipes Based on Unrolled Monocular Fisheye Images 2019 Johannes Künzel (Humboldt University Berlin), Thomas Werner (Fraunhofer IAIS), Peter Eisert (Humboldt University Berlin), and Jan Waschnewski (Berliner Wasserbetriebe)

Fusion of Keypoint Tracking and Facial Landmark Detection for Real-Time Head Pose Estimation 2028 Jilliam María Díaz Barros (German Research Center for Artificial Intelligence (DFKI)), Bruno Mirbach (IEE S.A.), Frederic Garcia (IEE S.A.), Kiran Varanasi (German Research Center for Artificial Intelligence (DFKI)), and Didier Stricker (Technische Universitat Kaiserslautern)

Learning Long-Term Invariant Features for Vision-Based Localization 2038 Niluthpol C Mithun (University of California), Cody Simons (University of California), Robert Casey (VWGoA Electronics Research Lab), Stefan Hilligardt (VWGoA Electronics Research Lab), and Amit Roy-Chowdhury (University of California)

Will People Like Your Image? Learning the Aesthetic Space 2048 Katharina Schwarz (University of Tübingen), Patrick Wieschollek (University of Tübingen), and Hendrik P. A. Lensch (University of Tübingen)

An Analysis of Human-Centered Geolocation 2058 Kaili Wang (ESAT-PSI), Yu-Hui Huang (ESAT-PSI), Jose Oramas M. (ESAT-PSI), Luc Van Gool (ETH/D-ITET/CVL), and Tinne Tuytelaars (ESAT-PSI)

Author Index 2067

xxv